OpenAI發布新人工智能系統:根據文字生成圖像

2021-01-07 09:48:44   來源:新浪   評論:0   [收藏]   [評論]
導讀:  舊金山人工智能研究公司OpenAI已經開發了一種新系統,能根據短文本來生成圖像。  OpenAI在官方博客中表示,這個新系統名為DALL-E,名稱來源于藝術家薩爾瓦多·達利(Salvador Dali)和皮克斯的機器人英雄瓦
  舊金山人工智能研究公司OpenAI已經開發了一種新系統,能根據短文本來生成圖像。

  OpenAI在官方博客中表示,這個新系統名為DALL-E,名稱來源于藝術家薩爾瓦多·達利(Salvador Dali)和皮克斯的機器人英雄瓦力(WALL-E)的結合。新系統展示了“為一系列廣泛的概念”創造圖像的能力,創作的作品包括牛油果形狀的扶手椅等。

  通過神經網絡去生成圖像,這種技術并不新穎。此前,生成對抗網絡(GAN)已被廣泛用于創建真實的人、寵物、租賃房產和食物的照片。

  不過,DALL-E的獨特之處在于可以根據輸入的文本來創作圖像。該系統基于文字生成系統GPT-3的一個版本,該系統此前被用于撰寫詩歌和新聞文章等。利用配對好的文本和圖像數據集進行訓練,DALL-E可以根據新的文字提示生成圖像,此外還展示了創造多種風格圖片的能力。

  OpenAI還發布了圖像識別系統Clip。Clip通用性比當前針對單個任務的系統更好,可以用網上公開的文字圖像配對數據集來訓練。

  DALL-E還需要繼續優化。OpenAI指出,DALL-E目前的可靠性還存在問題,對類似“glass”等有多個含義的名詞常常會混淆,文字中不同的語法也可能會造成不同的結果。

  此外還有更深層次的問題需要解決。OpenAI表示:“我們注意到,涉及生成模型的工作可能會產生重大而廣泛的社會影響。”未來可能的舉措包括研究對就業崗位的影響,生成結果的偏見,以及技術的長期道德挑戰。

  長期以來,公眾一直擔心人工智能生成的媒體內容被濫用,例如神經網絡被用來制造虛假的音視頻和圖像,用于不道德的目的,例如政治上的假信息和欺詐活動等。

分享到:
責任編輯:zsz

網友評論