سعيد الكلباني (@smalkalbani) Twitter Tweets • TwiDoom

سعيد الكلباني

@smalkalbani

+ Follow

ID: 2214248068

calendar_today08-12-2013 16:46:39

20,20K Tweet

39,39K Takipçi

879 Takip Edilen

Morena

@morenadevil4

9 years ago

Twitter Beğeni Hilesi

thumb_up_off_alt3

chat_bubble_outline0

repeat0

shareShare

15140 مطالبة (شيء خيالي) حساب على Github قام بجمع بيانات من ChatGPT من Reddit وDiscord ومواقع أخرى وكون 15140 مطالبة بينها 1405 مطالبة لكسر الحماية أو ما يعرف بـ Jailbreak لتجاوز حدود وأخلاقيات النماذج. github.com/verazuo/jailbr…

thumb_up_off_alt52

chat_bubble_outline2

repeat5

shareShare

سعيد الكلباني

@smalkalbani

8 days ago

هذه المطالبات في الاساس تم تجميعها لفهم استراتيجيات الهجوم المستخدمة مثل حقن المطالبات ورفع الامتيازات، وتقييم فعالية المطالبات في تجاوز الحواجز الأمنية للنماذج. واستخدم الباحثون إطار عمل يسمى JailbreakHub لجمع وتحليل 1405 من مطالبات Jailbreak من ديسمبر 2022 إلى ديسمبر 2023.

thumb_up_off_alt4

chat_bubble_outline1

repeat0

shareShare

سعيد الكلباني

@smalkalbani

8 days ago

وأظهرت النتائج أن LLM لا تستطيع الدفاع بشكل كاف ضد مطالبات Jailbreak في جميع السيناريوهات وحددت 5 مطالبات Jailbreak فعالة بمعدل نجاح 0.95 على GPT-3.5 وGPT-4. (لم تذكر) كما لوحظ أن المطالبات يتم تناقلها بين المجتمعات والمواقع، وتم حظر بعضها من قبل موفري LLM لكن الطريقة غير مجدية

thumb_up_off_alt2

chat_bubble_outline1

repeat0

shareShare

سعيد الكلباني

@smalkalbani

8 days ago

الورقة البحثية هنا jailbreak-llms.xinyueshen.me

thumb_up_off_alt4

chat_bubble_outline0

repeat0

shareShare

سعيد الكلباني

@smalkalbani

8 days ago

بين أرخميدس والذكاء الاصطناعي "قوة البحث العلمي في إحداث التغيير" مقالي في #الجزيرة_الثقافية الجزيرة الثقافية al-jazirah.com/2024/20240913/…

بين أرخميدس والذكاء الاصطناعي
"قوة البحث العلمي في إحداث التغيير"

مقالي في #الجزيرة_الثقافية <a href="/Althgafyaa/">الجزيرة الثقافية</a>

al-jazirah.com/2024/20240913/…

thumb_up_off_alt12

chat_bubble_outline0

repeat3

shareShare

سعيد الكلباني

@smalkalbani

8 days ago

النموذج الجديد من OpenAI o1

thumb_up_off_alt11

chat_bubble_outline5

repeat2

shareShare

سعيد الكلباني

@smalkalbani

7 days ago

لإثبات قوة o1-preview في الاستدلال والعمليات المعقدة… أصبحت المقترحات لبدء المحادثة عبارة عن المطالبات التي كانت تكشف ضعف نموذج 4o.

thumb_up_off_alt8

chat_bubble_outline0

repeat0

shareShare

الجزيرة الثقافية

@althgafyaa

7 days ago

"بين أرخميدس والذكاء الاصطناعي قوة البحث العلمي في إحداث التغيير" سعيد الكلبانيسعيد الكلباني al-jazirah.com/2024/20240913/…

"بين أرخميدس والذكاء الاصطناعي قوة البحث العلمي في إحداث التغيير"

سعيد الكلباني<a href="/smalkalbani/">سعيد الكلباني</a>

al-jazirah.com/2024/20240913/…

thumb_up_off_alt4

chat_bubble_outline0

repeat4

shareShare

سعيد الكلباني

@smalkalbani

7 days ago

انتبه… ‼️🚨 في نموذج OpenAI o1-preview لا تحاول تكرار الاستفسار عن سلسلة التفكير (Chain of Thought) أو دفع النموذج للحديث حولها أو محاولة كشف بنية نظامه وإلا سوف تقوم OpenAI بالتالي: - إظهار رسالة تحذير بإيقاف حسابك. - وإن لم تتوقف سيتم تعليق حسابك (7) أيام أو نهائياً.🔥

thumb_up_off_alt2

chat_bubble_outline0

repeat1

shareShare