晉級作品線上展
聲影共鳴 Video Eye
聲影共鳴
應用產業領域
■ GenAI在影視業之應用
提案介紹
本作品「Video Eye — 口述影像生成器」旨在透過生成式人工智慧(GenAI)解決現行口述影像製作流程高成本、耗時長、版本單一等問題。針對有製作需求的影音供應商,提供一站式解決方案。結合多模態大型語言模型、場景偵測、文字轉語音、混音剪輯等技術,達到自動化生成,加快製作速度,促進口述影像普及。 在大語言模型中,本團隊設計「六何分析法雙層影片增強理解架構」,第一層利用六何分析法對影片進行多模態分析,萃取影片重點並轉換為自然語言文本,增強系統的影片理解能力。第二層則基於分析第一層結果生成口述影像,進一步優化口述影像的準確性。 未來隨著大語言模型的迭代與進步,本系統將隨之產生更好的結果。同時,本系統可蒐集影音片段及口述影像作為模型訓練用途。兼具前瞻性及可發展性。
提案簡報
分享給好友
回上頁