רופא מתמחה, רופא כללי , וקידמה אקספוננציאלית 🤖

בשבת לפנות בוקר נערך בטקסס קרב אגרוף בין מייק טייסון (גיבור מוערץ) לבין ג'ייק פול אקס-יוטיובר שהוסב למתאגרף. התוצאה צפויה לצערי – 30 שנות הפרש הן רמז עבה… אבל, הקרב הזה הזכיר לי שרציתי לכתוב על "דו-קרב" אחר בעל תוצאות הרבה פחות צפויות: מודלי שפה גנריים מול מודלי שפה מתמחים.

🎯 ממון רב מושקע באימון ו/או fine-tuning של מודלי שפה

בתקווה ליצור מודל מתמחה שמניב ביצועים עדיפים בעולם תוכן ספציפי. מודלים אלו מכונים DAPT (domain adaptive pretraining).
לכאורה טריוויאלי ומתבקש: מודלים שאומנו (pre trained) ו/או כויילו (fine tuned) כירורגית להתמחות בעולמות רפואה או פיננסים למשל, אמורים להניב תשובות מדויקות יותר בשימושים ייעודיים ממודל גנרי עדכני.

לכאורה.
שני מחקרים שפורסמו מטילים ספק בפרדיגמה הזאת.

💰לקסם הבא אני זקוק ל-10 מיליון $ ומודל GPT3

בלומברג – ענקית פיננסים מהמובילות בעולם – השקיעה לפני שנה+ למעלה מ-10 מיליון $ ביצירת BloombergGPT – מודל שפה ייעודי מבוסס GPT3.5 שאומן על דאטה פיננסי קנייני וציבורי.

BloombergGPT הוא מודל שפה בן 50 מיליארד פרמטרים. הוא אומן מהבסיס – משימה יקרה השמורה בד"כ לשחקנים מובילים. הוכן dataset עצום שמתבסס על מידע פיננסי שנצבר מ-40 שנות פעילות, בתוספת מאגרי מידע פיננסיים ציבוריים שיצרו גוף-ידע של למעלה מ-700 מיליארד טוקנים אותם היא זיקקה ל 50.

היעד היה שאפתני והתוצאה סמוך להשקה היתה חד-משמעית: המודל של בלומברג הציג ביצועים טובים יותר בהשוואה למודלים דוגמת GPT3.5 במשימות פיננסיות, ולתוצאות דומות או עדיפות במשימות כלליות.

אמריקה, וורסאנו. או שלא תמיד?

במחקר מקיף שהתפרסם באוק 23 נמצא שמספר חודשים מאוחר יותר – מודל GPT4 החינמי הזמין לכל מביס אותו ברוב המבדקים.

הסיפור של BloombergGPT ממחיש בצורה הכי גרפית את העקרון של "שיפור אינטרינסי אקספוננציאלי" ביכולות מודלי שפה והמשמעות הדרמטית שלו על אסטרטגיות מוצר או הצעת ערך.

⚕️האם מודלים רפואיים מתמחים בהכרח עדיפים?

חוקרים מאוניברסיטאות קרנגי-מלון וג'ון הופקינס פרסמו לאחרונה מחקר שמטיל ספק דומה בתחום הרפואי. המחקר השווה בין מספר מודלי שפה מתמחים (טקסטואלים וחזותיים) לבין מודלי הבסיס הגנריים המקבילים.


ניתן לעובדות לדבר:

מודלים מתמחים טקסטואליים
הניבו תשובות נחותות בהשוואה לאחיהם "הלא משכילים" ב 38.2% מהמבדקים, השיגו תיקו ב 49.8% מהם, והביסו את אחיהם "הגנריים" רק ב- 12.1% מהמבדקים.

המודלים החזותיים
הביסו את אחיהם הגנריים רק ב 6.3% מהמבדקים, הגיעו לתיקו ב 81.3%, והובסו ב 12.5% מהמבדקים.

📈 מחשבות ותובנות שלדעתי ראוי שכל מקבל החלטות ישקול:

שיקלו להשקיע באימון או fine-tuning במקרים מאד מובחנים

דוגמאות: דאטה ייחודי ובעל משמעות דרמטית לאיכות התשובה, צורך בסמנטיקה עמוקה או רצון לנתח/לבנות גרף ידע בתחום מאד מתמחה.

"פקטרו" שיפור "אבולוציוני" במוצר שלכם שנובע משיפור במודל-השפה

קצב השיפור האקספוננציאלי של מודלים גנריים מאפשר לעתים לתכנן מפת דרכים שממנפת שיפור "עצמוני" במוצר ⭐שלכם⭐ שנובע מעצם השיפור במודל הגנרי השלוב בו.

נסו שלא "לנוון" שיפור זה בגלל ארכיטקטורת שילוב/פרומפטינג קשיחה.

טכניקות פרומפטינג מדויקות

(דוגמת COT , few shots) כמו גם הינדוס חכם של זרימת השימוש במודלי השפה הגנריים מוכחים כיכולים לשפר דרמטית את איכות ועקביות התשובות

 

עוד כתבות עבורך

כשמתודולוגיית GAIN שלנו הופכת לסטנדרט אימות AI ארגוני

לשמחתי, אצלנו בשטראוס התקופה גדושה בלווי ארגונים במסע לאימוץ בינה-מלאכותית. לצערי, זה גם התירוץ מדוע נותר לי מעט זמן לכתוב פוסטים ומאמרים. אבל, חייב לשתף אתכם בחוויה – איך Open AI ו- Perplexity גרמו לי להסמיק "בשידור חי"…

 

מעשה שהיה כך היה…

אנחנו בשטראוס אסטרטגיה רואים שליחות להפיץ את תפיסת "AI-first mindset" בקרב מנהלים, קולגות ואנשי מקצוע – במאמרים, וובינרים, הסכתים, חשיפות הנהלה, ועוד. ברמה האישית אני שגריר נלהב של המיינדסט הזה. איך זה מתבטא "קלינית"? מהם תופעות הלוואי? המממ…. למשל, כשלקוח או קולגה שואלים שאלה במייל או בוואטסאפ שאני סבור שעוזרי ה AI הווירטואליים שלי יכולים להשלים ולהעשיר את התשובה שלי, פעמים רבות אני פשוט מצרף לתשובה "האנושית" שלי גם קישור לתשובה שנתן chatgpt או perplexity לשאלה הזו. אני (כמובן) מעודד אותם להמשיך בשיחה "מאותה נקודה", בואכה התשובה הספציפית עבורם.

 

בשבוע שעבר, ההרגל הזה תפס אותי בהפתעה…

באחד הכנסים המקצועיים מצאתי את עצמי משוחח עם סמנכ"ל טכנולוגיות בחברה פיננסית גדולה. על רקע קפה דהוי משהו סיפרתי לו על מודל ההפעלה שגיבשנו בשטראוס לאימוץ ארגוני של בינה מלאכותית, GAIN שמו, ועל לקוחות שכבר מיישמים אותו. הוא לקח לגימה מהקפה (וביס מהבורקס) ושאל אותי אם יש עוד best-practices ואסטרטגיות אימוץ AI הוליסטיות מוכרות שנפוצות בישראל. סאקר של המיינדסט הזה של לשלב כוחות עם AI, סיננתי לו "בוא נשאל את chatgpt בדיוק את זה".

בעודי שואל את ChatGPT, הולכת ונולדת בי החוצה תחושת חרטה וכפכוף עצמי. לחוץ שעוד רגע ג'פטו ילרלר name dropping של אסטרטגיות ופרקטיקות ממותגות מבית היוצר של ענקיות ייעוץ גלובליות…

 

אבל הי, לא באנו ליהנות…

טו-לייט…ואז ג'פטו ענה. והתשובה הפתיעה וחייכה אותי, מפיצה חום נעים בבית החזה…ג'פטו מספר כבר בהתחלה על GAIN , מבית שטראוס אסטרטגיה, ומפרט את מרכיבי האסטרטגיה שלה. עשירית שניה אחרי, פרפלקסיטי עונה תשובה דומה ומציג את GAIN כאסטרטגיה ראשונה לאימוץ AI ארגוני.אימאל'ה ואבאל'ה!

מילא לשתף את כל העולם כמה המתודולוגיה שלנו לאימוץ AI ארגוני יכולה ליצור קסמים בארגון. אבל זה וואו לגמרי לגלות ששני יישומי ה Gen-AI ב top 3 מספרים על GAIN שלנו כשיטה מרכזית לאימוץ AI ארגוני…ואם כבר "מחשבה יוצרת מציאות": שבוע מאוחר יותר פגשנו 2 מכרזים לגיבוש מודל הפעלה לאימוץ AI ארגוני, והדרישות לספקים מנוסחות בהלימה כמעט מוחלטת למודל האימוץ שלנו…כנראה שאתם עושים משהו טוב, אמר לי חבר טוב.

כנראה, עצמי עונה לי.

בתמונות – מי אנחנו שנתווכח עם התשובות שנתנו עוזרי ה AI שלנו…

 

 

וובינר מנהיגות טכנולוגית: כיצד להפוך את מערכות המידע למנוע צמיחה עסקי

וובינר מקצועי למובילים טכנולוגיים: מנהיגות טכנולוגית כמנוע צמיחה 🚀

מעל 180 משתתפים הצטרפו לוובינר שלנו "מנהיגות טכנולוגית: כיצד להפוך את מערכות המידע למנוע צמיחה עסקי", שבו עסקנו באתגרים המרכזיים של מובילי IT בארגונים.

על מה דיברנו?
✅ איך מגבשים אסטרטגיית IT שתהיה גם יציבה וגם גמישה
✅ כיצד למנף בינה מלאכותית מתקדמת – גם ברמת האפליקציות וגם בתשתיות
✅ איך מובילים שינוי טכנולוגי משמעותי מבלי לפגוע ביציבות התפעולית
✅ התמודדות חכמה עם מערכות לגאסי והתקדמות למודרניזציה

🎙️ תודה ענקית לדוברות ולדוברים שלנו, שהביאו תובנות מעשיות מהשטח ויצרו שיח מעורר השראה! 📌
מוזמנים לצפות בהקלטה ולהעמיק בתובנות החשובות ששיתפנו. צפייה מהנה! 🔗 ⬇️

 

מ-POC להצלחה: המדריך המעשי להטמעת AI Code Companion בארגונים

בעידן שבו חדשנות טכנולוגית מהווה יתרון תחרותי משמעותי, הטמעת AI Code Companions בארגוני Enterprise אינה אופציה – היא הכרח אסטרטגי. מחקרים מראים כי כלים אלו מסוגלים להעלות את הפרודוקטיביות של צוותי הפיתוח ב-15% עד 40%, נתון משמעותי שמתרגם ישירות לערך עסקי. אולם, ההבדל בין רכישת כלי לבין הטמעה מוצלחת שלו הוא עצום.

אבל רגע לפני שנמשיך, כדאי לעשות "יישור קו" לגבי המושג עצמו: למה מתכוונים כשאומרים AI Code Companions  ומדוע הם כך כך חשובים?

AI Code Companions הם כלים מבוססי בינה מלאכותית שנועדו לעזור למפתחים בתהליך כתיבת הקוד, תיקונו, שיפורו ותחזוקתו. מדובר ב"עוזרים" חכמים שמתפקדים כחלק מסביבת העבודה של המתכנתים, ומציעים תמיכה טכנית ולוגיסטית בזמן אמת.

אל מול התיאור הנ"ל, מדוע אם כן, ארגונים רבים כל כך עדיין לא מצליחים ביישומם? התשובה לשאלה הזו היא למעשה תיאור האתגר האמיתי שאיתו גופי IT רבים מתמודדים איתו כיום:

ארגוני Enterprise בישראל ניצבים כיום בפני אתגר מורכב: מצד אחד, הצורך להאיץ תהליכי פיתוח ולשפר איכות קוד הוא קריטי להישרדות בשוק תחרותי. מצד שני, הטמעת טכנולוגיות AI בתהליכי הפיתוח מעלה שאלות מורכבות של אבטחת מידע, ציות רגולטורי, והתנגדות מצד המפתחים. מחקרים מראים כי 68% מהארגונים שרכשו כלי AI לפיתוח נתקלו בקשיים משמעותיים בהטמעה מסיבות שונות ומגוונות (למשל: פערי ידע בקרב מפתחים בצוותי הפיתוח מה שמייצר אי אחידות ביכולת היישום בשטח, חוסר במדיניות ארגונית ברורה לשימוש בכלים – מה מותר ומה אסור?, חשש נרחב ומוכר מצד צוותי פיתוח לגבי איום אפשרי מצד כלים שכאלו ועוד).

בזמן שאתגרים וחסמים לא חסרים באף ארגון, המאמר הזה נועד לספק מפת דרכים מעשית להטמעה מוצלחת של AI Code Companions, תוך התמקדות בערך העסקי והתמודדות עם האתגרים האמיתיים שארגונים נתקלים בהם.

הסעיפים הבאים הינם בגדר המלצה בלבד וכמובן שכל ארגון יכול לאמץ את הנקודות והמאפיינים שמתאימים למבנה ולתפיסה הארגונית הספציפית. 

 

שלב 1: הכנה והערכת מידת המוכנות הארגונית

עוד בטרם בחירת כלי כזה או אחר, חיוני לבצע הערכת מוכנות של הארגון וצוותי הפיתוח. הערכה זו כוללת: 

  • סקירת תהליכי פיתוח קיימים: זיהוי נקודות כאב והפוטנציאל לשיפור
  • הערכת תשתיות טכנולוגיות: בחינת תאימות לשילוב כלי AI
  • סקר מוכנות צוותים: הערכת רמת הידע והנכונות לאימוץ טכנולוגיות חדשות
  • ניתוח דרישות רגולטוריות: הבנת מגבלות, דרישות אבטחת-מידע ורגולציה

שלב 2: בחירת פתרון ותכנון הטמעה

ביסוס הבחירה בפתרון המתאים על קריטריונים מדידים שגם מתאימים לארגון:

  • יכולות טכניות ודיוק – האם נדרש לימוד של כל ה- codebase הקיים?
  • תמיכה בשפות פיתוח ובפלטפורמות רלוונטיות
  • מודל תמחור ו-ROI צפוי
  • ריצה ב- on-prem או בענן

שלב 3: יישום והטמעה בפועל (זה ה-MONEY TIMEׂ):

  1. הקמת צוות מוביל – מינוי champion מכל צוות פיתוח
  2. תכנית הכשרה מדורגת ומותאמת לצוותים על בסיס הקוד הארגוני:
  • סדנאות בסיס לכל המפתחים ומעבר על use-cases רלוונטיים
  • הכשרות מתקדמות למובילים טכניים
  •  ליווי אישי ותמיכה בשלבים הראשונים
  • מדיניות ארגונית ונהלים:
  • מסמך Governance מקיף
  • הנחיות לשימוש בטוח

שלב 4: מדידה ואופטימיזציה

כמו בכל פרויקט הטמעה נרצה להגדיר יעדים ומדדי הצלחה שיראו לארגון שאנחנו בדרך להצלחה.
מדדי הצלחה יעילים יכולים להיות, למשל:

  • קיצור זמני הפיתוח עד ליצירת ה- pull request
  • כמות שורות קוד שיוצרו בעזרת AI Code Companion (ביחס לכמות הקוד הכוללת)
  • חיסכון בשעות פיתוח בחודש ו/או הגדלת מספר משימות הפיתוח
  • עלות ממוצעת לשורת קוד
  • איכות הקוד – ירידה במספר ההערות של static code analysis

מתיאוריה לפרקטיקה: סיפור הצלחה מקומי

אחת מחברות הפינטק המובילות בישראל, בליווי שלנו, הצליחה להטמיע בהצלחה כלי AI Code Companion בצוותי הפיתוח שלה. עם צוות של כ-45 מפתחים, החברה הפכה למקרה בוחן מרתק של הטמעה מדורגת ואפקטיבית של יכולות AI, שהביאו לשינוי משמעותי בתהליכי העבודה.

 

התוצאות מדברות בעד עצמן:

  • 80,000+ שורות קוד שנוצרו בעזרת הכלי – האצה מרשימה בתפוקה.
  • קיצור זמני הפיתוח: מסך חדש ב-React, שדרש בעבר 10 ימי עבודה, מפותח כיום תוך 3 ימים בלבד.
  • 80% מהמפתחים משתמשים בכלי מדי יום – עדות ליעילות ולנוחות של הכלי.
  • 50% מהצעות הכלי אומצו בפועל על ידי המפתחים, מה שממחיש את הערך האמיתי של הטכנולוגיה.

 

הסיפור הזה מוכיח שכשמאמצים פתרונות AI בצורה חכמה, אפשר לייצר שינויים מרחיקי לכת בשגרה, לייעל תהליכים, ולתת לצוותים כלים לעבוד טוב יותר.
רוצים לדעת איך גם אתם יכולים לשלב פתרון AI Code Companion בארגון שלכם? אנחנו כאן כדי לעזור לכם לעשות את הצעד הבא.

 

5 המלצות להטמעה מוצלחת של AI Code Companions בארגון שלך

הטמעת כלי AI Code Companion יכולה להוביל למהפכה בצוותי הפיתוח שלך – אבל כדי שזה יקרה, נדרשת גישה מחושבת ותכנון נכון. הנה מה שחשוב שתיקחו איתכן/ם מהמאמר הזה:

  1. הכנה מקדימה היא המפתח
    לפני שאתם בוחרים או רוכשים כלי, השקיעו זמן בהבנת הצרכים והיעדים של הצוות שלכם. בנו תשתית טכנולוגית וארגונית שתומכת בהטמעה.
  2. הטמעה הדרגתית – לא למהר
    התחילו בצוות פיילוט קטן שיבחן את הכלי בפועל, ויישמו שיפורים תוך כדי תנועה. לאחר מכן, הרחיבו את השימוש על בסיס הלקחים שנלמדו.
  3. תהליך מתמשך, לא חד-פעמי
    הדרכה אחת פשוט לא מספיקה. בנו תכנית הטמעה מתמשכת עם הדרכות תקופתיות, דגש על יישום מעשי, ותמיכה טכנית שוטפת כדי להבטיח הצלחה ארוכת טווח.
  4. תמיכה תרבותית בארגון
    שתפו את המפתחים בתהליך קבלת ההחלטות והתאימו את הכלי לצרכים שלהם. שיתוף פעולה יוצר מחויבות אמיתית ומגדיל את הסיכוי להצלחה.
  5. מדידה ושיפור מתמידים
    הגדירו מראש KPIs ברורים, כמו שימוש יומיומי בכלי או הפחתת זמני פיתוח. עקבו אחריהם באופן שוטף ושפרו את התהליכים בהתאם.

רוצים לדעת איך ליישם את זה אצלכם בארגון?
צוות המומחים שלנו ישמח להבין את האתגרים שלכם, וייסע בגיבוש תכנית הטמעה. פנו אלינו ל: maya@s-strategy.com