אמנות פוגשת בינה מלאכותית: הדור הבא של יצירות ה-AI

שי אלון, Startup Evangelist ב-Google Cloud, הסביר היום ב-Geektime Code 2025 איך משלבים מדע, אמנות וסקריפטינג באמצעות שימוש ב-Imagne4 ו-Veo3

ניב גילינסקי
9.6.25

כנס Geektime Code 2025

בשנים האחרונות הפכנו כולנו, כל אחד ואחת מאיתנו, ליוצרי אמנות. זאת אומרת, אנחנו כותבים פרומפט וה-AI עושה את העבודה. אך היכולות החדשות הפכו להיות הרבה מעבר לסתם יצירה של תמונה חביבה, ועל זה בדיוק דיבר היום (ב') בכנס Geektime Code 2025 שי אלון, Startup Evangelist ב-Google Cloud שהסביר איך אפשר לשלב בין מדע, אמנות וסקריפטינג באמצעות שימוש בכלי ה-GenAI החדשים ביותר של גוגל – Veo 3, Imagen 4, ו-Gemini TTS Native Audio.

"כל אחד בעולם יכול להיתקל בפיד שלו במדיה החברתית בסרטון שנוצר על ידי AI, וזה בעיקר בגלל הקפיצה משום שהיכולות של האודיו והווידאו של ה-AI הגיעו לאותה הרמה של יצירת הטקסטים", הסביר אלון וגילה כי החלום שלו היה לכתוב ספר שעוסק וחיי היום-יום של בעלי חיים, אילו הייתה להם עבודה אנושית. כעת, עם הבינה המלאכותית, הוא גם הדגים איך אפשר, עם מעט עבודה ומחשבה יצירתית, לעשות את זה בזמן קצר.

"היה לי פרומפט מוכן על מדריך הטיפוס גקו, אבל אף מודל AI לא הצליח לג'נרט בדיוק את מה שאני רוצה, כולל הפרטים הקטנים כמו חמש אצבעות שיהיו מעין שילוב של גקו ובן אדם וטקסט מאחוריו עם הסלוגן של המקום 'stick with it' – ואז  Imagen עשה את זה בשניות:

מתוך המצגת של שי אלון, כנס Geektime Code 2025.

אבל הבאזז האמיתי הוא לא רק בתמונות, אלא בווידאו, אז אלון הדגים איך בעזרת פרומפט קצר אפשר לייצר סרטון שבו אנדרואיד (רובוט בדמות אנוש) מתאהב בבן אדם. ההגבלה של Veo 3 היא רק ל-8 שניות, אבל כל סרטון בהחלט יכול להרגיש כמו הפקה הוליוודית.

את האמת, קצת רימינו. בווידאו הזה אלון לא ביקש מהרובוט לשיר, הוא גם לא ביקש שהידיים יהיו רובוטיות, אלו תוספות של ה-AI, אבל גם הן מדגישות את הרמה שבה היום כל אחד, בעזרת טקסט מדויק, יכול לייצר וידאו שייראה כמו הפקה קולנועית במקרה הטוב, וכמו הונאה מאוד איכותית במקרה הרע.

שימו לב להבדלים

אחד הדברים שעליהם כדאי לשים את הדגש בתקופה הזו הוא יכולת זיהוי התוכן שנוצר באמצעות בינה מלאכותית. אז הנה ניסוי קטן עבורכם, הסרטון הבא הוא באורך 32 שניות, האם תוכלו לזהות מתי ה-AI מפספס?

זיהיתם? אם לא, נגלה לכם את שתי הנקודות הבולטות ביותר: האבק שבחדר שמתחיל לשנות כיוון בצורה לא טבעית, וההליכה של הדמות אל תוך החלל השחור שבתחילת הסרטון בכלל היה קיר. ה"פספוסים" של ה-AI נובעים מכך שמדובר בארבעה סרטונים שחוברו יחדיו, משום שכאמור לכל סרטון של VEO3 יש הגבלה של 8 שניות בלבד. לכן, כדי לייצר 32 שניות, אלון לקח את הפריים האחרון בסרטון הראשון וביקש מ-Veo לייצר 8 שניות נוספות לאחריו, וכך עוד פעמיים עד להשלמת הסרטון. ה-AI לא ידע שבסרטון המקורי היה קיר בחלל השחור, ולכן החליט לשלוח לשם את הדמות.

המקום שבו אמנות פוגשת תכנות

בשלב הזה אלון הסביר כי נתקל בבעיה באחת הסצנות שכתב לסיפור שלו, ולכן שינה כיוון: "פרומפטים הם קוד וכבר יש לנו תהליכים מוצלחים לעבוד עם קוד, אז למה שלא נשתמש בהם גם להנדסת פרומפטים (פרופמט אנג'נירינג)?". הוא הזין את ההנחיות לתוך קרסור- ה AI IDE החביב עליו, והורה למערכת לשנות את הפרומפטים לפרומפט בצורת פסקאות, שנוחות לעבודה עבור מודלי התמונה ווידאו, וקיבל בדיוק את מה שרצה. לדבריו, עדיף להשתמש בסביבת קוד של גיט ו IDE כדי לעבוד על הפרומפטים, מכיוון שנוחות העבודה עליונה מזו שתתקבל מצ'אטבוט בלבד.

בנוסף, אלון המליץ לנצל את יכולות ה-Gemini Deep Research על הדרך הנכונה להשתמש ב-Veo 3, על מנת להבין איך לייצר ולחדד את הפרומפטים לצורה המדויקת בדיוק. את תוצאות ה-Deep Research ולהזין את התוכן הזה ביצירת פרומפטים חדשים באמצעות AI. אלון גם משתף בטיפ חשוב לדוברי העברית: אפשר לבקש בפרומפט להוסיף ניקוד לפי זכר או נקבה, לאחר מכן להכניס את הפרומפט לתוך כלי הסאונד, דוגמת Gemini Text to Speech, וה-AI ייצר לכם בדיוק את הסאונד שרציתם, כולל אופי, טונציה, מהירות ומין הדובר.

העתיד לטענתו, עבור יצירות האמנות החדשות ב-AI, יהיה כאשר תוכלו להכין את כל הסרטונים המדהימים האלו, ופשוט לבקש מה-AI שיחליף דמות אחת באחרת, ויזואליה וסאונד כאחד, ולקבל בדיוק את אותו התוצר, ללא אף שינוי למעט זה שביקשתם. "אנחנו לא עוד לא שם, אבל החלום הזה בדרך", סיכם.

הרצאה זו הייתה חלק מההרצאות בכנס Geektime Code 2025 שנערך היום (ב') בתל אביב

תודה לשותפים שלנו

Silver
intuitworkdayGoogle CloudDRIVENETSnvidia&bynet
Bronze
leumiGotfriendsPapayaApplied MaterialsStarkWareMillenniumCheck PointSQLinkZOHOSisenseSELAoracleproceed

משרות פתוחות

קטגוריות

זה המקום להכיר את החברות, המשרדים וכל מי שעושה את ההייטק בישראל (ויש גם מלא משרות פתוחות!) #תוכן מקודם