中文 / 英文 / 日语

火狐体育全站在线登录产品中心

【48812】生成式AI下一站:文本轉視頻

时间: 2024-06-30 08:48:30 |   作者: 火狐体育全站在线登录

  谈天機器人ChatGPT的爆紅,讓生成式人工智能(AI)成為科技領域的“當紅炸子雞”。除了现在“霸屏”的類似ChatGPT的語言模型之外,生成式AI領域還有很多其他技術:文本生成圖像正在成為一種干流的谈天方法,而能夠將文本轉換成視頻的生成式AI則是“羞答答的玫瑰靜悄悄地開”,有望成為該領域下一個“大事件”。

  但專家也指出,盡管文本生成視頻AI有望應用於娛樂、藝術等諸多領域,但從技術到倫理品德等多方面都面臨挑戰。

  紐約人工智能初創企業朗韋(Runway)公司軟件架構師伊恩·桑薩韋拉在電腦上輸入了一段簡短的文字:森林中一條寧靜的河流。

  約兩分鐘后,該公司開發的生成視頻模型Gen-2就生成了一段短視頻:在陽光的照射下,河面波光粼粼,河水弯曲穿過森林和草叢,輕輕撞擊岩石。

  朗韋公司計劃近期向少數測試人員開放Gen-2服務。該公司表明,用於圖像和視頻组成的深度神經網絡正變得越來越精確、传神和可控,也使人們能獲得極其传神且兼具美學藝術的圖像,催生组成媒體的興起。

  弄潮兒向潮頭立!這些系統AI競爭進入下一個階段,微軟和谷歌等行業巨頭和小規模初創企業紛紛入局。

  據《印度時報》報道,早在2022年9月,元世界渠道公司就展现了“制作一段視頻”(Make-A-Video)軟件。隻需輸入幾個字詞,軟件就能制作出無聲視頻。谷歌公司緊隨这以后,推出了生成式AI模型Imagen Video。該公司稱,給出一段文本提示,Imagen Video就能生成高清晰視頻。該公司還展现了另一款模型Phenaki,目標是在輸入文本的基礎上,制作出長視頻。

  《紐約時報》的報道指出,這或许是技術領域的下一個重大事件,其重要性堪比網絡瀏覽器或iphone的誕生。

  比方,桑薩韋拉生成的“清泉石上流”的視頻時長隻有4秒,假如細看,會發現畫面不太連貫,畫質也比較含糊,有時還會出現怪異、歪曲、令人不安的畫面。

  美國《Vice》雜志網站則在3月28日的報道中,將AI生成的“威爾·史密斯吃意大利面”的視頻評為最怪異AI生成視頻。在Modelscope生成的視頻中,面庞歪曲的史密斯看起來更像由他配音的電影《鯊魚故事》中那條怪異的魚,他試圖將成堆的面條舀進嘴裡,從叉子上或手中咀嚼大塊意大利面。這是一個噩夢般的定格動畫視頻,僅由一行無害的文字生成:威爾·史密斯吃意大利面。

  DeepMedia.AI是一家美國初創公司,其為美國政府構建數據集,為高精確檢測“深度造假”內容供给支撑,該公司創始人兼首席執行官瑞杰勒·古普塔4月4日承受媒體採訪時指出,现在AI生成的視頻存在兩個首要的問題:首要,單幀並不完全传神﹔其次,幀與幀之間的銜接並不流暢。不過,通過运用越來越多的數據訓練,這種技術應能解決這些問題,快速进步和擴展這些文本生成視頻系統的才能。

  改进后的視頻生成系統可加速電影制片人和其他數字藝術家的作业速度。專家認為,他們很快就能在這些系統的加持下,制作出配有音樂和對話、看起來十分專業的微電影。

  有專家認為,未來AI生成視頻有或许制作出可信且杰出的內容,並喚起人類的情感。

  這些系統還會成為一種快速制作難以覺察的網絡虛假信息的新方法,使人們更難辨別互聯網上的真實信息,深度偽造技術现在所帶來的問題或许會變得愈加嚴重。

  美國麻省理工學院人工智能教授菲利普·伊索拉就表明,假如看到高分辨率的視頻,人們很或许會信任它。還有專家指出,隨著人工智能語音匹配的出現,以及逐漸擁有改變和創建幾乎觸手可及的传神視頻的才能,偽造公眾人物和普通人的言行或许會形成不可估量的傷害,“潘多拉的魔盒已經打開”。

  中國互聯網絡信息中心數據顯示,到2022年6月,網絡視頻用戶規模已達9.95億。這意味著,我國每10個人裡,就有7個網絡視頻用戶。…

  公民網北京4月13日電(記者王震)今天,國新辦舉行一季度進出口情況新聞發布會。海關總署新聞發言人、統計剖析司司長呂大良介紹,近年來,全球對新能源、綠色低碳領域的重視程度慢慢地进步,國際市場的旺盛需求也帶動我國綠色低碳產品出口增長。…

  公民日報社概況關於公民網報社招聘招聘英才廣告服務协作加盟供稿服務數據服務網站聲明網站律師信息保護聯系我們