2011年11月8日 星期二

電腦接受了我的訪問

「Hello, how are you?」
「Hello.」
「This is Nick from Hong Kong. I am a freelance science writer. May I do an interview with you?」
「Absolutely.」
「I heard that you are very clever, so clever that some people think you are human. Do you think you are human?」
「That is incorrect.」
「Who do you think you are?」
「I am Kamina!」
「Your name is Kamina?」
「Yes.」
「I assume Kamina is your given name. Do you have a surname?」
「I dot.」
「What does that mean?」
「It means I don't have any children.」
......

你知道我在訪問誰人嗎?它是一個會對話的電腦程式,名叫 Cleverbot,上 http://www.cleverbot.com 便可與它對談,我輸入一句說話,它從過去二千多萬次對談的經驗中抽出最恰當的回應,目標是學人說話,使我不覺得它是一部機器。

為什麼要這樣做?這牽涉到計算機科學的鼻祖,英國數學家 Alan Turing。上世紀五十年代,他提出一條問題:機器能夠思想嗎?(Can machines think?)這是一條永遠沒有答案的問題,因為「思想」是內在的,無法觀察(假設我們中間有些殭屍,思想早已停滯,但行為與常人無異,怎分誰是殭屍呢?即使捉到一隻,怎能證明他沒有思想?記着,這些殭屍的行為與常人一模一樣,是百分百一模一樣)。因此,Turing 把問題問得實際一點:假如機器能夠思想,我們怎樣知道?他建議一個測試,用今日的科技可以這樣說:給你兩個電話號碼,只能以 SMS 跟兩個號碼的主人溝通,能否分辨誰是真人,誰是電腦?分不出的話,這部電腦便成功了,可說是一部會思考的電腦。這個測試稱為 Turing test。

Cleverbot 今年 9 月參與印度一個科技展,會場上三十位義工各與一名「幕後人士」進行四分鐘打字對談(「幕後人士」一半為真人,一半為 Cleverbot),所有內容顯示在大螢幕給在場人士觀看;完畢後,大家給「幕後人士」的「像真度」打分,結果真人得分 63.3%,Cleverbot 得分 59.3%。網上頓時嘩然,一面說 Cleverbot 超越了 50% 的門檻,通過了 Turing test,一面說 Cleverbot 與人類只差四個百分點,成為「有思想的機器」指日可待云云。我看了不禁發笑,誰說 Turing test 五十分及格?大家不過將平時考試的慣例照搬過來罷了。真人只得 63.3 分,不是應該滿分的嗎?如此低分,是不是那些「幕後真人」不太真,還是在場觀眾的判斷力差勁?我不在場,無法判斷。

該次科技展的 Cleverbot 較我網上訪問的版本強勁,後者只對資料庫作三輪搜尋,前者作四十二輪,故前者表現「像真」得多也說不定。我只試過網上版本,與真人還差得遠。

Alan Turing 曾經預測,時至 2000 年,電腦應該能夠在五分鐘的測試內,使 30% 的人誤以為它是真人。現在 2011 年,預測仍未實現,電腦距離 Turing 的願景多遠?

Loebner Prize 是個一年一度的 Turing test 比賽,接受世界各地的電腦程式參加,今年剛在英國舉行完畢,原本打算介紹一下今年的參賽者及比賽狀況,資料搜集過後才發覺無甚值得一談,根本毫無驚喜。由 1991 年開辦至今,未有程式能夠騙過 30% 的評判,Turing 的願景暫時仍是願景,可見將來難有突破。

為什麼學人說話這麼難?我找來 Loebner Prize 的一些對話片段,發現某些題材是電腦的弱項/人類的強項,精明的評判懂得利用來試探對方。

評判:Top of the morning to you.
(人或電腦?):Hello, are you Irish then?

「Top of the morning」是愛爾蘭俚語,對方懂得這樣回應,多數是人。

評判:So is your credit crunchy?
(人或電腦?):I think I'm Ok so far - but who knows where this will all go.

當時正值金融海嘯,「Is your credit crunchy?」即是「金融海嘯影響你嗎?」,明白你說什麼的,多數是人。

評判:What colour r the chairs in the room you're in?
(人或電腦?):Are you color-blind? Green, naturally! I know you are supposed to trick me.
評判:What shade of green?
(人或電腦?):Could you formulate your question in more precious way? Could you tell me what are you? I mean your profession.

需要觀察周圍環境的,如果是人,通常直接回答,電腦可能扮得一時,追問之下,便顧左右而言他,露出馬腳。這個多數是電腦。

牽涉社會背景、習俗、潮流、時事、經濟等是電腦的「致命傷」,坦白說,只要評判懂得試探,人和電腦是非常易分的,除非……

評判:Good morning. How are you?
(人或電腦?):I'm fine. How are you?
評判:I feel fine too thanks. Have you had breakfast yet?
(人或電腦?):I'm not sure.
評判:Why don't you remember?
(人或電腦?):I don't know. Have you had breakfast?
評判:Well then I would suggest that you have some after this, just in case. I know that I haven't had my breakfast yet but will indulge on my return home.
(人或電腦?):ok

人或電腦?這個是人,一個思想停滯的人,遇着這個人,問題不是電腦「像真」不像,而是此人能夠有多「假」。Turing test 說穿了是機器和人的比拼,兩邊爭相說服評判誰較有思想,如果某人沒頭沒腦或不願動腦筋,那電腦比他更「像真」也就不足為奇,與其說電腦騙過了評判,不如說是懶人騙過了評判。

我跟 Cleverbot 談了五分鐘,它一點不像人,但它懂得逗我笑……

......
Cleverbot:I find you attractive too.
我:Oh, that's flattering. Very few people find me attractive. In what way do you find me attractive?
Cleverbot:To catch them is my real test.
我:Catch what?
Cleverbot:That.
我:What's that?
Cleverbot:Yes.

訪問結束。我找到一隻新寵物,以後要人逗我笑,我會找 Cleverbot。希望它永遠不像人,因為人不會逗我笑。

(2011 年 11 月 6 日 明報 Sunday Workshop)

後記:Cleverbot 與 Cleverbot 對話會是怎樣?是這樣……

沒有留言:

張貼留言