Google開源了其研究論文Ask the Right Questions: Active Question Reformulation with Reinforcement Learning之中,主動問答(ActiveQA)系統的TensorFlow套件,能被用於訓練增強學習人工智慧代理人重新設計問題。ActiveQA結合問答系統以及自然語言,能重新設計問題以更多問題進行搜尋,最後取得比傳統問答系統更好的答案。

在傳統的問答系統中,使用監督式學習技術結合標記資料,來訓練能夠回應任意問題的系統。Google表示,這在某種程度上是有用的,但最重要的是,這種方式缺乏人類處理不確定性問題的能力,無法重新理解並設計問題,進行更廣泛的搜尋,以獲得綜合評估和匯總回答。

受人類「問對的問題」的想法啟發,Google在ActiveQA在中加入了反覆諮詢的問答系統,這個人工智慧代理會多次重新合成原始問題,以便能搜尋到最佳的可能答案。Google之所以稱這個問答系統為積極的(Active),正是因為人工智慧代理人會與QA系統進行動態互動,以提高最終答案的品質。

以「特斯拉何時出生?」這個問題為例,代理人會以兩種不同的方式提出問題「特斯拉的生日是什麼時候?」以及「特斯拉哪一年出生?」,根據兩個問題的答案,系統最終會決定回傳「1856年7月10日」作為答案。

Google提到,ActiveQA系統的特點就是能學會提出可以獲得更好答案的問題。但是要訓練人工智慧提問並不容易,由於包含原始問題還有更好的替代問題,這樣形式的問題對(Question Pairs)訓練資料取得並不容易,因此ActiveQA採用了強化學習,以便人工智慧代理人可以和環境互動的同時,採取能獲得最大化獎勵的行動。

ActiveQA代理人在與問答系統互動時,根據答案的品質來評估問題重新設計的好壞,而這便形成了獎勵行為,當答案是好的,那學習演算法便會調整模型參數,以便再次產生更有可能獲得好答案的問題。Google以更佳的提問,訓練出比傳統問答系統還要好的結果,Google提到,這是一個重要的研究,因為問答系統已經透過監督系統訓練,而ActiveQA的人工智慧代理則可以學習複雜,但仍然可以解釋的重新制定策略。

Google這次釋出的ActiveQA TensorFlow套件由三個主要元件組成,其中包含了訓練和執行ActiveQA代理人所有必須程式碼。Google表示,他們致力於全球資訊普遍可用,而ActiveQA則是實現這個使命重要的一步,ActiveQA能助Google設計出更好可解釋的問答系統,同時也能幫助其他人開發以自然語言互動的系統。

熱門新聞

Advertisement