בינה מלאכותית והעולם החדש

הביקורת שלי על Gemini 3

כולם הולכים להתחרפן על מספרי בנצ'מרקים. ובצדק – המספרים באמת הזויים, קפיצות משוגעות כמעט בכל קטגוריה. אבל אני לא רוצה לעשות את זה פה.

אני חי עם Gemini 3 כמה ימים. לא "ניסיתי דקה". ממש עבדתי איתו – כתבתי איתו, בניתי איתו, בדקתי איך זה מרגיש כשזה נכנס ליום עבודה אמיתי. בנצ'מרקים אומרים לכם מה הוא יודע לעשות (והוא יודע המון). אני רוצה לדבר על איך זה מרגיש להשתמש בו.


הדבר הראשון שתפס אותי: כתיבה יצירתית שלא מריחה כמו AI

אני אתחיל מכתיבה יצירתית, כי שם הוא הפיל לי את הלסת.

GPT-5.1 שיצא שבוע שעבר כבר היה קפיצה מורגשת ביחס להרבה מודלים חזקים שהתרגלנו אליהם. אבל Gemini 3? הוא כתב לי פרקים בסגנון ספר שגרמו לי לעצור ולחשוב "רגע, זה בטוח לא מועתק מאיזה ספר אמיתי?".

הקול עקבי. הקצב טבעי. יש ניסוחים שמפתיעים באמת. והכי חשוב – זה לא מרגיש כמו הכתיבה הזאת של "AI סלופ" שכולנו מזהים אחרי שתי שורות. זה לא "טוב יחסית ל-AI". זה פשוט כתיבה טובה.

והשיפור מרגיש בסיסי, לא קוסמטי. בהרבה מודלים קודמים יש מין "קפיצות" באיכות – משימה אחת יוצאת גאונית, ואחריה משימה אחרת יוצאת סתם בסדר. Gemini 3 הרבה יותר יציב. פחות עם אותם רגעים מעצבנים של "וואו" ואז "אה, נו באמת".

יש לי תחושה שGoogle פיצחו משהו בלמידה מחיזוק גם במשימות שאין בהן "תשובה נכונה" שאפשר לבדוק בקליק – יצירה, סגנון, טעם. התוצאה היא מודל שמרגיש יותר כמו שותף עבודה מוכשר מאשר כמו כלי שמדי פעם זורק פנינים.


הקטע הטריקי: ברוב היום שלכם אולי לא תרגישו את ההבדל

פה חשוב להגיד משהו שלא כולם אוהבים לשמוע: ב-80% מהדברים היומיומיים, יכול להיות שבכלל לא תרגישו שזה "וואו".

המודלים שיש היום כבר מספיק טובים בשביל מיילים, ניסוח קצר, תיקוני טקסט, שינויים קטנים באפליקציה, דברים מהירים. אז ממבט ראשון, Gemini 3 לא תמיד מרגיש כמו קפיצה ענקית.

אבל זה מטעה.

הקפיצה מסתתרת ב-20% הקשים: ריזונינג מורכב, בחירות יצירתיות עדינות, מקרי קצה שבהם מודלים אחרים מתחילים להתפרק, וצריך עוד "מוח" כדי לא ליפול על פתרון שטחי. כשבאמת צריך את זה – הוא שם.


"אינטליגנציה לשניה" – והוא חזק בזה

עוד משהו שבולט: הוא מהיר יחסית לכמה שהוא חכם.

אם נמדוד את זה כמו "אינטליגנציה לשניה" – Gemini 3 נותן פה יחס מטורף. אתם מקבלים גם איכות וגם מהירות, וזה משנה את איך שעובדים. פחות המתנה, פחות "טוב אני אחזור לזה אחר כך", יותר זרימה.

אני לא רוצה להיכנס להשוואה ישירה מול GPT-5 Pro כי מצב ה-Deep Think (או המקביל שלו) לא היה זמין לי בבדיקה המוקדמת, אבל עדיין – בלא מעט משימות, גם הגרסה הרגילה של Gemini 3 נתנה לי תוצאה שהרגישה חזקה יותר, בלי לחכות 5-10 דקות.


אופי וסגנון: פחות מתחנף, יותר ענייני

יש שינוי גם באופי.

כברירת מחדל, Gemini 3 פחות "מתלטף" ממודלים אחרים. הוא לא פותח במחמאות מוגזמות ואז שלושה פרקים של הקדמה. הוא יותר קצר. יותר ישיר. נותן תשובה וברוב המקרים עוצר.

אני מעדיף את זה.

אני לא צריך שהמודל יספר לי כמה אני גאון ויפזר לי קונפטי. אם אני רוצה עוד פירוט – אני אבקש. ברגע שהוא ענייני, הוא מכבד את הזמן שלי. עם ChatGPT לפעמים אני מוצא את עצמי גולל ומחפש את ה"תכלס" בתוך הרבה מלל. פה זה פחות קורה.

עוד נקודה לטובה: בהרבה מודלים יש "דמות ברירת מחדל" שממש קשה לברוח ממנה. פה הוא פשוט מקשיב. אם אתם אומרים לו "תכתוב כמו בלש ציני משנות ה-40 אבל מודרני" – הוא ננעל על זה באמת, בלי להחליק חזרה לסגנונות AI גנריים ומעיקים.


Antigravity IDE: מוצר חזק, אבל צריך לשמור עליו

ה-IDE שלהם (Antigravity) מרשים ביחס למוצר השקה. זה מרגיש כמו סביבת עבודה אמיתית, לא כמו דמו.

האינטגרציה של דפדפן-בדיקות ממש שימושית: הוא מרים שרת, בודק אם הוא השיג את המטרה, עושה איטרציות בלי שתעברו הקשר או שתתערבו בכל צעד. כשזה עובד – זה מעולה.

אבל – וזה אבל חשוב – צריך לעשות לו בייביסיטר.

לפעמים הוא מסתכל על לוג לשניה, מכריז "סיימתי", וממשיך הלאה כשהבילד עדיין עם שגיאות. לפעמים הוא מצלם מסך של UI, אומר "נראה טוב", ומפספס שהאתר בכלל לא רץ. חייבים להשאיר את הטרמינל פתוח, להריץ בדיקות שוב, ולהגיד לו מפורשות לוודא.

עוזר מאוד לשים הנחיות קבועות כמו:
"תמשיך לקרוא לוגים תוך כדי שאתה מרים דברים עד שאתה יודע שזה באמת עובד".

למפתחים שנמצאים עם היד על הדופק, זה כלי חזק. למי שמחפש כפתור קסם – זה יכול לעצבן. מצד שני, זה נשמע כמו דברים שכנראה ישתפרו עם הזמן דרך התאמות פרומפטים ושדרוגים בצד שלהם.


הטריידאוף

אם GPT-5.1 מרגיש כמו ג'וניור טוב, Gemini 3 מרגיש כמו סניור שאומר "קיבלתי, עשיתי", ואתם עדיין צריכים לבדוק שהוא באמת עשה.

אני מוצא את עצמי חוזר אליו שוב ושוב. לא כי הוא מושלם, אלא כי כשהוא פוגע – הוא פוגע בצורה כמעט אנושית. מבריק, מדויק, ומפתיע לטובה.

בשורה התחתונה: זה הפך להיות ה"דיילי דרייבר" שלי. ואם לוקחים בחשבון את הכוח של Google להרים דברים כאלה בקנה מידה, בזול וביציבות – יש לי תחושה שזה הולך להיות מנצח.

Shares:
כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *