網路人氣票選聲影共鳴 Video Eye

晉級作品線上展

聲影共鳴 Video Eye

聲影共鳴

應用產業領域

■ GenAI在影視業之應用

提案介紹

本作品「Video Eye — 口述影像生成器」旨在透過生成式人工智慧（GenAI）解決現行口述影像製作流程高成本、耗時長、版本單一等問題。針對有製作需求的影音供應商，提供一站式解決方案。結合多模態大型語言模型、場景偵測、文字轉語音、混音剪輯等技術，達到自動化生成，加快製作速度，促進口述影像普及。在大語言模型中，本團隊設計「六何分析法雙層影片增強理解架構」，第一層利用六何分析法對影片進行多模態分析，萃取影片重點並轉換為自然語言文本，增強系統的影片理解能力。第二層則基於分析第一層結果生成口述影像，進一步優化口述影像的準確性。未來隨著大語言模型的迭代與進步，本系統將隨之產生更好的結果。同時，本系統可蒐集影音片段及口述影像作為模型訓練用途。兼具前瞻性及可發展性。

成果展示

提案簡報

提案簡報點我看

分享給好友

回上頁

投票