הסתקרנתי מה-Omni AI החדש של גוגל לשכפול וידאו – ואז שקלתי את ההשלכות

רנה ראמוס/ZDNET

עקוב אחר ZDNET: הוסף אותנו כמקור מועדף בגוגל.

נקודות המפתח של ZDNET

Google Omni שואפת לעשות עבור וידאו את מה שננו בננה עשתה עבור תמונות.
יוצרים יכולים לבנות סרטונים מטקסט, תמונות, אודיו או וידאו.
אווטרים של AI יכולים לעזור ליוצרים, אבל לעורר חששות אמון.

בשבוע שעבר הכריזה גוגל על יכולת חדשה של וידאו בינה מלאכותית שתסייע לקריאייטיבים לייצר סרטונים באיכות גבוהה יותר בקלות רבה יותר, או שתגדיל בצורה ניכרת את כמות הירידה בבינה מלאכותית ביוטיוב. אני מהמר שזה יהיה שילוב של שניהם.

גוגל הכריז על Gemini Omniכלי שמעלה את היכולת ליצור וידאו באמצעות AI לרמה חדשה לגמרי. החברה השוותה את ההכרזה הזו לרמת השיפור ביצירת תמונות בינה מלאכותית שהושגה כאשר הוציאה את ננו בננה.

כמו כן: Google I/O 2026: הכל הוכרז

ננו בננה העלה את הרף במידה ניכרת לגבי מה שאפשר עם יצירת תדמית. Omni מתיימר לעשות את אותו הדבר עם וידאו. אומני התחיל להתגלגל, אבל לא הייתה לי הזדמנות לשחק עם זה.

גוגל תיארה את Omni כ"מקום שבו היכולת של תאומים להגיב פוגשת את היכולת ליצור". מעניין לציין שלפי החברה, "עם Omni, אתה יכול לשלב תמונות, אודיו, וידאו וטקסט כקלט וליצור סרטונים באיכות גבוהה המבוססים על הידע האמיתי של ג'מיני."

למרות ש-Omni "מתחיל בווידאו", אמרה גוגל שהדגם החדש יכול "ליצור כל דבר מכל קלט", כך שככל הנראה נראה סוגי מדיה אחרים שנוצרו על ידי הכלי תוך זמן מועד.

כמו כן: 6 אפליקציות Android Auto הלוואי ומצאתי מוקדם יותר, כי הן מקלות על כל נסיעה

Omni יהיה זמין גם בשכבות דגמים, החל מעכשיו עם Gemini Omni Flash. היכולת מגיעה לאפליקציית Gemini, Google Flow ו-YouTube Shorts. לא ברור אם גרסת האינטרנט של Gemini תתמוך ב-Omni, או שתצטרך להשתמש בממשק Flow דרך הדפדפן שלך.

יש כמה תכונות בולטות שהופכות את זה להצעה מאוד מעניינת.

שכפל את עצמך

אני בכנות לא יכול להחליט אם זה הולך להיות תכונה בולטת, דאגה גדולה מאוד לפרטיות, או מחולל סלופ לא קשור. החברה אמרה שאתה יכול ליצור סרטונים "עם הקול שלך על ידי שימוש באווטארים, שיוצרים גרסה דיגיטלית של עצמך כדי שתוכל ליצור סרטונים שנראים ונשמעים כמוך".

כמו כן: השתמשתי בננו בננה 2 כדי ליצור הערות סקיצות מושלמות: 5 שיעורים למדו

כמפיק קבוע של סרטוני יוטיוב לערוץ שלי, אני מסוקרן. היו מקרים שרציתי להוציא סרטון, אבל היה לי יום שיער רע, יום קול רע או יום גישה גרוע, ופשוט לא רציתי שזה יתקל בווידאו.

האם אוכל פשוט להזין תסריט לאוואטר התאום הדיגיטלי שלי ולבקש מ-RoboDave לדבר? האם הקהל שלי ישים לב? האם יהיה אכפת להם? האם הם ישנאו את זה? האם הייתי עושה זאת? ברור שזה תחום שראוי להתנסות בו, אבל זה כנראה לא משהו שאשתמש בו לעתים קרובות.

אני עושה את ערוץ היוטיוב שלי, בין השאר, כדי שהדברים וההצגות שלי לא יהיו תקועים. הטלת עבודה על אווטאר דיגיטלי עשויה להפחית את עומס העבודה שלי, אבל זה גם יפחית את האימון והתרגול שלי.

גוגל מקפידה מאוד לומר שהיא משלבת את טכנולוגיית טביעת האצבע הדיגיטלית SynthID שלה בסרטים אלה, כך שניתן לאמת אותם כאילו הופקו עם Omni. גוגל אמרה גם, "מעבר לתכונת האווטאר, במונחים של עריכת סרטונים כדי לשנות אודיו ודיבור, אנחנו עדיין עובדים כדי לבדוק זאת ולהבין טוב יותר כיצד אנו יכולים להביא את היכולת הזו למשתמשים באחריות".

מודל פיזיקה

חלקכם אולי זוכרים את הימים הראשונים של משחקי הווידאו, כאשר דמויות התנהגו יותר כמו ragdolls מאשר אובייקטים בעולם הפיזי. ככל שהמשחקים השתפרו, הם החלו לשלב מודלים של פיזיקה, כך שאם משהו נורה, הופל לאחור או נשמט, הוא עשה זאת בעניין שתואם את הפיזיקה של האובייקט.

אומני משלבת כעת פיזיקה בסרטונים שהיא יוצרת. גוגל אמרה שיש לה "הבנה אינטואיטיבית משופרת של כוחות כמו כוח משיכה, אנרגיה קינטית ודינמיקת נוזלים". הוא גם משתמש בידע של תאומים כדי "לחבר שפה, דימויים ומשמעות בדרכים שחורגות הרבה מעבר להתאמת דפוסים".

כמו כן: סימני המים החדשים של OpenAI מקלים על זיהוי זיופי בינה מלאכותית – הנה איך

החברה אמרה ש-Omni יכול לבנות סרטונים מפורטים מהנחיות קצרות ויכול ליצור סרטונים לדברים כמו מסבירים שמפרקים רעיונות מורכבים למדי. אני לא מטיל בכך ספק. יכולות הניתוח של סקירת האודיו וסקירת הווידאו של NotebookLM כדי ליצור מסבירים הן מדהימות. אם חלק מהטכנולוגיה הזו מצאה את דרכה לאומני, דברים יכולים להיות מעניינים במהירות.

למעשה הזנתי מסמכים שיווקיים ודפי מפרט ל-NotebookLM וזה הפיק סרטוני הסבר למאפיינים שונים של מוצר האבטחה שלי שהיו טובים יותר מכל מה שיכולתי לעשות ביד, במיוחד בזמן שלקח. הוויזואליה באותה תקופה לא הייתה נהדרת, אבל תכונות מורכבות שהוסברו בסרטון נקי תוך פחות מ-30 דקות היו מכפיל כוח עבור לוח הזמנים שלי לשחרור המוצר.

מגוון קלט

אחד המאפיינים הבולטים המוקדמים של Nano Banana היה היכולת שלה ליצור מחדש את ההקשר של תמונה. למשל, ביקשתי ממנו לצלם אותי הולך בפארק ולהחליף אותו כך שלבשתי משהו קרוב למדי אדמירל על גשר של נושאת מטוסים. הוא אמנם לא קיבל את סלט הפירות האחיד והפליז בדיוק כמו שצריך, אבל הוא הצליח לשחזר במדויק את הגוף והפנים שלי.

וגם: הפכתי סלפי מזדמנים לצילומי ראש מקצועיים עם תאומים

אומני מציעה לקחת את זה לווידאו, ולהפוך תמונה, טקסט, וידאו או אודיו ל"פלט מלוכד". נכון לעכשיו, האודיו היחיד שהיא תקבל הוא הקלטות קול, אבל החברה אמרה שהיא "תוציא בקרוב סוגים אחרים של כניסות אודיו".

החברה גם אמרה שאתה יכול ליצור סצנות, להתאים סגנונות, לתאר את מה שאתה רוצה בשפה טבעית, ולקבל עקביות אופי לאורך הסרטון.

עריכת שיחה

היבט אחד של הפקת סרטונים שאני לא נהנה ממנו הוא תהליך העריכה. זה לעתים קרובות מאוד מייגע. אבל, עם Omni, "Gemini Omni נותן לך דרך קלה יותר לערוך וידאו – עם שפה טבעית. כל הוראה מתבססת על האחרונה. הדמויות שלך נשארות עקביות, הפיזיקה מחזיקה מעמד והסצנה זוכרת את מה שהיה קודם."

גוגל גם אמרה שאתה יכול לשנות אלמנטים בסרטון. אני יכול לראות יתרון עצום אם אפשר לייבא סרטון ולבקש מהעורך להסיר חסימות או לשנות אובייקטים ורקעים. לא ברור כמה זמן קליפ יכול להיות, או בדיוק כמה עריכה אתה יכול לעשות עם Omni בתוכנית נתונה, אבל האפשרויות האלה מרגשות.

כמו כן: האם Sora 2 וכלי וידאו אחרים של AI מסוכנים לשימוש? הנה מה שאומר חוקר משפטי

שתי שינויים נוספים שהחברה אמרה שהאומני החדש יכול לעשות הם:

לשנות דברים ספציפיים, או לשנות הכל. הסרטון שלך הופך לנקודת ההתחלה למשהו שלא היית יכול לצלם בעצמך.
צלם סרטון שצילמת ופשוט בקש מאומני לשנות את מה שקורה. ערוך את הפעולה, הוסף דמויות או אובייקטים חדשים, או הפוך רגע למשהו בלתי צפוי.

בנוסף, גוגל עדיין לא ציינה פורמט וידאו או רזולוציה. האם זה יהיה כלי מקצועי שיוכל להתמודד עם סרטוני 16:9 ברזולוציית 4K או 8K, או שהוא אמור להיות כלי לדור ה-YouTube Shorts?

כאשר OpenAI הציגה את Sora, זה היה חידוש. בעוד שמשתמשים התעללו בו (הענקנו לסם אלטמן שיער כחול וגרמנו לו לשיר את השבחים של ZDNET), זה מעולם לא הצליח להיות כלי שעזר לזרימת העבודה של איש מקצוע.

למרות שייצור שיבוטים של אווטאר בינה מלאכותית והחלפת אובייקטים עשוי להיות כיף, אני מקווה שהיכולת הזו יורחב כך שתהיה שמישה בתוך Final Cut, Premiere Pro ו- DaVinci Resolve, או לפחות משולבת מספיק כדי שהכלים האלה יוכלו להשתמש בעריכות שנוצרו על ידי Omni.

זה אפשרי. התכונות של Omni יושקו ללקוחות ולמפתחים ארגוניים באמצעות Google API.

כמו כן: סימני המים החדשים של OpenAI מקלים על זיהוי זיופי בינה מלאכותית – הנה איך

אני גם סקרן אם אומני תטמיע את סימן המים של היהלום הקטן בפינת הסרטונים שלו, כמו שהוא עושה עם התמונות שנוצרו של ננו בננה. למרות שזה נחמד לדעת שקליפ נוצר על ידי AI, סימן מים כזה מפריע לשימוש ב-AI ככלי מקצועי.

האם נראה שכבות רישוי שבהן ניתן להסיר את סימן המים? או שמא נראה צצים כלים של צד שלישי שמסירים את סימן המים, בין אם גוגל תרצה ובין אם לא? הזמן יגיד.

האם היית משתמש ב-Google Omni כדי ליצור אווטאר דיגיטלי שלך עבור סרטונים שלא רצית להקליט באופן אישי? ספר לנו בתגובות למטה.

אתה יכול לעקוב אחר עדכוני הפרויקט היומיומיים שלי ברשתות החברתיות. הקפד להירשם ל עלון העדכונים השבועי שליועקבו אחרי בטוויטר/X ב- @DavidGewirtzבפייסבוק בכתובת Facebook.com/DavidGewirtzבאינסטגרם בכתובת Instagram.com/DavidGewirtzבבלוסקי בשעה @DavidGewirtz.comוב-YouTube ב- YouTube.com/DavidGewirtzTV.

Source link

על פי הדיווחים, ראש הבטיחות של OpenAI עוזב כחלק מארגון מחדש של החברה

חוק הלחיצה לביטול החדש של ממדני מקל על תושבי ניו יורק לבטל מנויים

מי צריך scalpers כאשר GameStop מסמן כרטיסי פוקימון ביותר מ-300 אחוז?

'המנדלוריאן והגרוגו' הסתיים, אבל רוטה ההאט היא לנצח

לבלוסקי יש שוב מנכ"ל רשמי

סקירת סקירת Engadget: Steam Machine, Samsung Music Studio 7, Oura Ring 5 ועוד

You may have missed

Welcome to Benefits Street on the beach: Plagued by drugs, violence and people having sex in public, inside Bournemouth's downfall… and how NEIL SEARS was spat at, punched and abused when he went to investigate

שריאס אייר הופך לקפטן השני בלבד כדי להשיג את ההישג הבא כמעט בלתי אפשרי; יודע כאן

אנליסט ESPN מתרחק לאחר שקטוע את זרועו בזמן ש-AG חוקרת האשמות פרועות

Netflix's New Western Remake Proves Early Season 2 Renewal Worthwhile With #2 Streaming Debut