המכון לעתיד החיים

פרובוקציה | מכתב גלוי: הקפיאו ניסויי ענק בבינה מלאכותית

אנו קוראים לכל מעבדות הבינה המלאכותית להקפיא מיד ולמשך שישה חודשים לפחות את האימון של מערכות בינה מלאכותיות חזקות יותר מ GPT-4

19/11/2025

זמן קריאה: דקות

22 מרץ, 2023 || מכון עתיד החיים

מערכות בינה מלאכותית בעלות אינטליגנציה המתחרה בתבונה האנושית עלולות להציג סיכונים משמעותיים לחברה האנושית ולאנושות כולה, כך נמצא במחקר מקיף של התחום (1) שהוכר ע"י מעבדות מובילות לבינה מלאכותית (2). כפי שנאמר במסמך אסילומר (סיכום כנס AI מיטיב 2017, מכון 'עתיד החיים', אסילומר, קליפורניה), מסמך עקרונות בינה מלאכותית שהתקבל ונתמך באופן נרחב, "בינה מלאכותית מתקדמת עשויה להביא לשינוי עמוק בהיסטוריה של החיים על פני כדור הארץ; יש להתכונן לקראת שינוי זה ולנהל אותו בזהירות הראויה ומשאבים מתאימים". למרבה הצער, רמה זו של תכנון וניהול אינה מתרחשת, בעוד שבחודשים האחרונים אנו עדים למרוץ מתגבר בין מעבדות בינה מלאכותית, כולן לכודות בתהליך שיצא מכלל שליטה לפיתוח ופריסה של מוחות דיגיטליים רבי-עוצמה שאף אחד – אף לא יוצריהם – מסוגל להבין או לחזות את התנהגותם, או לשלוט בהם באופן אמין.

מערכות AI עכשוויות מתהוות לפנינו ומסוגלות לתחרות ברמה האנושית בביצוע משימות כלליות (3), עלינו לשאול את עצמנו: האם נכון לתת למכונות להציף את ערוצי המידע שלנו בתעמולה ואי-אמת? האם נכון לבצע אוטומציה מלאה וגורפת לכל העבודות, כולל המספקות שבהן? האם נכון להמשיך ולפתח מוחות לא-אנושיים שעלולים בסופו של דבר לעלות עלינו במספרם ובחוכמתם, לעשותנו מיושנים, מיותרים, ולהחליף אותנו? האם נכון עבורנו להסתכן באובדן שליטה על הציוויליזציה שלנו? אסור להאציל החלטות הרות-גורל שכאלו לקבוצה של מנהיגי תעשייה וטכנולוגיה שמעולם לא נבחרו ושאינם נבחרי ציבור. נכון לפתח מערכות בינה מלאכותית עוצמתיות שכאלו רק ואך ורק כשאנו בטוחים שההשפעות שלהן תהיינה חיוביות והסיכונים, ברי-ניהול. בטחון זה חייב להיות מאושש ומוצדק היטב, ולגדול בהתאמה למידת ההשפעה הפוטנציאלית של כל מערכת. ההצהרה האחרונה של OpenAI בנוגע לבינה מלאכותית כללית (AGI), קובעת כי "החל משלב מסוים ייתכן שיהיה חשוב לבצע ביקורת חיצונית ועצמאית לפני שמתחילים בהכשרת מערכות עתידיות; עוד מנקודה זו ואילך, על היוזמות המתקדמות ביותר להסכים להגביל את קצב הצמיחה המחשובי המשמש ליצירת מודלים חדשים". אנו מסכימים עם הצהרה זו. הגענו לשלב האמור.

על כן אנו קוראים לכל מעבדות הבינה המלאכותית להשהות מיידית ולמשך 6 חודשים לפחות את האימון של מערכות בינה מלאכותיות החזקות יותר מ GPT-4. הקפאה זו צריכה להיות ציבורית, ברת-אימות, ולכלול את כל השחקנים המרכזיים בתחום. אם לא ניתן לבצע הקפאה כזו במהירות על ממשלות להתערב וליזום מורטוריום ממשלתי. מעבדות בינה מלאכותית ומומחים עצמאיים צריכים להשתמש בהקפאה זו כדי לפתח ולהטמיע יחדיו מערך של פרוטוקולי בטיחות משותפים לתכנון ופיתוח של בינה מלאכותית מתקדמת, פרוטוקולים שנבדקים תדיר ובקפדנות ומפוקחים בשוטף על ידי מומחים חיצוניים ובלתי תלויים. על פרוטוקולי בטיחות אלה להבטיח ולוודא כי מערכות הדובקות בהם בטוחות מעבר לכל ספק סביר (4). משמעות המהלך אינה השהייה מוחלטת של פיתוח בינה מלאכותית באופן כללי אלא רק צעד אחורנית מהמרוץ המסוכן לעבר מודלי קופסה-שחורה גדולים יותר ויותר, בלתי צפויים ובעלי יכולות מתהוות.

המחקר והפיתוח של בינה מלאכותית צריך לחזור ולהתמקד בהפיכת המערכות החדשניות ורבות-העוצמה של ימינו ליותר מדויקות, בטוחות, ניתנות לפירוש והבנה, שקופות, חסינות, מותאמות בפעולתן לערכים אנושיים (aligned), אמינות (trustworthy) ונאמנות (loyal).

במקביל, חובה על מפתחי AI לעבוד עם קובעי מדיניות ומקבלי החלטות בכדי להאיץ באופן דרמטי את הפיתוח של מערכות חזקות למשילות AI. מערכות אלו צריכות לכלול לכל הפחות: רשויות רגולטוריות חדשות, מוכשרות וברות סמכא, המוקדשות לבינה מלאכותית; תהליכי פיקוח ומעקב אחר מערכות בינה מלאכותית בעלות יכולת גבוהה ואחר מאגרים גדולים של יכולות חישוביות; מערכות איתור מקור וסימוני מים בכדי לעזור באבחנה בין האמיתי לסינטטי ובמעקב אחר דליפות מודלים; אקוסיסטם נרחב של ביקורת והסמכה; וידוא אחריות וחבות ביטוחית לנזקי AI; מימון ציבורי איתן למחקר טכני של בטיחות AI; ומוסדות ממונים-היטב להתמודדות עם השיבושים הכלכליים והפוליטיים הדרמטיים (במיוחד לדמוקרטיה) שייגרמו ע"י בינה מלאכותית.

האנושות יכולה ליהנות מעתיד משגשג עם AI. משהצלחנו ביצירת מערכות בינה מלאכותיות רבות עוצמה, אנו יכולים כעת ליהנות מ"קיץ AI", תקופה בה נקטוף את פירות ההצלחה, נהנדס את המערכות הללו לטובת הכלל ונעניק לחברה האנושית הזדמנות להסתגל. החברה האנושית הקפיאה בעבר את פיתוחן של טכנולוגיות אחרות שהיה להן פוטנציאל להשפעות הרות-אסון על האנושות (5). אנו יכולים לעשות זאת גם במקרה זה. הבה נתענג מקיץ AI ממושך, אל לנו לדהור חסרי מוכנות לעבר תהום הסתיו.

Notes and references

[1]

Bender, E. M., Gebru, T., McMillan-Major, A., & Shmitchell, S. (2021, March). On the Dangers of Stochastic Parrots: Can Language Models Be Too Big?🦜. In Proceedings of the 2021 ACM conference on fairness, accountability, and transparency (pp. 610-623).

Bostrom, N. (2016). Superintelligence. Oxford University Press.

Bucknall, B. S., & Dori-Hacohen, S. (2022, July). Current and near-term AI as a potential existential risk factor. In Proceedings of the 2022 AAAI/ACM Conference on AI, Ethics, and Society (pp. 119-129).

Carlsmith, J. (2022). Is Power-Seeking AI an Existential Risk?. arXiv preprint arXiv:2206.13353.

Christian, B. (2020). The Alignment Problem: Machine Learning and human values. Norton & Company.

Cohen, M. et al. (2022). Advanced Artificial Agents Intervene in the Provision of Reward. AI Magazine, 43(3) (pp. 282-293).

Eloundou, T., et al. (2023). GPTs are GPTs: An Early Look at the Labor Market Impact Potential of Large Language Models.

Hendrycks, D., & Mazeika, M. (2022). X-risk Analysis for AI Research. arXiv preprint arXiv:2206.05862.

Ngo, R. (2022). The alignment problem from a deep learning perspective. arXiv preprint arXiv:2209.00626.

Russell, S. (2019). Human Compatible: Artificial Intelligence and the Problem of Control. Viking.

Tegmark, M. (2017). Life 3.0: Being Human in the Age of Artificial Intelligence. Knopf.

Weidinger, L. et al (2021). Ethical and social risks of harm from language models. arXiv preprint arXiv:2112.04359.

[2]

Ordonez, V. et al. (2023, March 16). OpenAI CEO Sam Altman says AI will reshape society, acknowledges risks: 'A little bit scared of this'. ABC News.

Perrigo, B. (2023, January 12). DeepMind CEO Demis Hassabis Urges Caution on AI. Time.

[3]

Bubeck, S. et al. (2023). Sparks of Artificial General Intelligence: Early experiments with GPT-4. arXiv:2303.12712.

OpenAI (2023). GPT-4 Technical Report. arXiv:2303.08774.

[4]

Ample legal precedent exists – for example, the widely adopted OECD AI Principles require that AI systems "function appropriately and do not pose unreasonable safety risk".

[5]

Examples include human cloning, human germline modification, gain-of-function research, and eugenics.