Sunday, August 31, 2014

Pattern Recognition

(轉載自CUP magazine 2014年8月號)

最近,一位上了年紀的香港專欄作家對我說,他已學會用電腦寫稿,只要身在有網絡的地方,按一個鍵便傳到報社,真方便快捷,又慳紙!這些明日黄花的「發現」我本來沒興趣聽。之後,他更長篇大論想當年日子多辛苦,要用原稿紙寫稿,每晚要請專人送稿到報館!後來有了傳真機,省卻舟車勞動,但有時在外地的傳真費比稿費更多,得不償失,概嘆今天iPad真是他的恩物!

我耐心等他懷舊完,才問他學懂用那個中文輸入法。他說用手寫板便可以,中英文也可輸入,你用手指、用電子筆任由尊便,寫得點草都得,寫錯點擦都得!這麼厲害?用甚麼軟件?他說一個app攪掂!我一看之下,唉!原來他說的所謂用電腦寫稿,其實只是在iPad打開一張白紙,在上面畫圖,只不過他畫的圖案,中國人一看便知是中文字而已!那個app根本沒功能把那些「永」字五筆線條變成電腦中文代碼,報社收到手寫稿後再要有專人替他輸入電腦,但對他老人家來說已是踏出第一步。

能夠把線條變成電腦文字代碼,是涉及一個軟件發展史上一個今天還力求打破極限的重大命題 ―― 人工智能研究領域中的Pattern Recognition ,「認嘢」!   Recognition最顯淺的解釋是「睇」到又「認」到;Pattern就是你想「認乜嘢」。「認到嘢」有乜好處?基本上兩大好處:一是可以不經人手輸入電腦;二是用電腦替你「摷」嘢!

先說認字。

認字最初是用在支票或一些重要單據的號碼上,使電腦能「認」到自動輸入,快速兼準確。始祖是Optical Character Recognition(OCR)。OCR歷史悠長,早於一九三O年Emanuel Goldberg已設計了一副機器能「認」到一種特別字體,後來被IBM買了專利,沿用至今,我們護照上的號碼就是OCR字體。一九七四年,Ray Kurzweil更開發出可「認」到任何印刷字體的OCR(for omni-fonts),再轉發聲音讓盲人也可「閱讀」,所以現在的發聲字典和發聲電子書並不是甚麼新奇事物。

當時,可以OCR機器只限於不同印刷字體,我們還要等待另一突破,就是Handwriting Recognition(HWR)。回想起一九九三年蘋果推出全球首個PDA產品Newton,號稱能認出手寫字(只限英文),我滿心歡喜去會展看發佈會。結果大失所望,我先要學會一種特別的英文字母、數字和標點符號的書寫法(後來Palm PDA也用的Graffiti),但我沒嚇怕!但用了(炫耀了)一段日子,效果依然不理想。Newton最終慘淡收場,誰說蘋果沒滑鐵盧!

今天拿起Newton和iPhone在手,百般滋味在心頭,相隔十多年,HWR技術翻了幾翻,中英文手寫輸入已很成熟了,但依然沒有老人家說享用到的功能 ―― 寫得點草都得!
說完認字,再說認人。

比喻有人拍一張照片傳給你,想你認人的話,人的肉眼便可認到相中你熟悉的人物;想認風景或其他甚麼Pattern的話,人腦的思維活動又不同。今夭我們連人腦怎「認嘢」所知不多,希望用一件死物電腦,用軟件代替人腦的聯想力「認嘢」更是難過登夭,已開發了的特殊硬件和數學運算algorithm,只能侷限應用於少數範圍內,例如從龐大資料庫中認人緝兇是其中之一,由電腦替你把和樣本相似的人「摷」出來。

認人軟件雖然準確度還未夠理想,谷歌已把一些相關技術轉移到我們的電子相簿caption上,希望將來我們只要告訴軟件「他是誰」一次,以後「他是誰」再出現便能自動標簽。古語中「人之不同,如其面焉」這句話不無道理,亦可知「認人」軟件難度之高。
然而,放在「認指模」上,數值範圍小很多,今天「認指模」軟件已很成熟。原來人類的指模中的所謂Minutiae並不多,只有十種左右,全是二維平面,和面容三維特徵比較容易準確把握得多。

再說認聲(Voice Recognition)。我當然希望在我有生之年有套完美的廣東話輸入軟件出現,讓我可以用把口寫稿。咦!且慢!在此先扯開說說,以前要在洋行當秘書一定要懂速記,好讓洋上司口述一些甚麼memo和reply letter文件,秘書可以夠快dictate到。有了袖珍錄音機後速記的技能可省掉,但我一直奇怪當時是否在大洋行每個華洋經理也可以出口成文的。有了廣東話輸入軟件我是否也可以出口成文?我自認不能,今天和將來也不能!所以,廣東話輸入軟件對我幫助不大。

那麼,那些人需要用聲音輸入?
就此,先複述一下以上電腦能「認字」和「認人」的兩大好處,一是可以不經人手輸入,二是用電腦替你「摷嘢」,但一說到電腦能「認聲」,我們的要求便不是輸入電腦這樣簡單。很自然地,我們要求「講嘢要有人(電腦)聽」,最好對方更要有反應(互動),換言之,需要用聲音輸入就是一些要發號師令的人,期望自動有Follow up action!所以認聲軟件,除了輸入準確外,還要附有Speech Recognition(語言辨認,明你講乜)、Speaker Recognition(聲線辨認,知你邊個)功能和一系列program跟尾。

iPhone推出未成熟的Siri被人笑了好陣子,正是以上的功能未成熟之故。之後,市面推出一大堆認聲軟件,我敢說在這階段,這些產品完全是把我們消費者當白老鼠,我們還要搞清楚,一些只是省回按一個鍵的「聲控」軟件而不是真的「認聲」軟件。

當然,我也渴望有朝一日,一個「叫它做乜它懂得做乜」的機械人出現。那天,我們的人工智能軟件已不只是能認字、人和聲這樣原始;要令你感覺到是真的是在發號師令,機械人要連你自己那一刹也察覺不到的下意識Pattern也要Recognize到,唉!人啊人,我們到底想點?(完)





創新、科技,甚麽局?

(轉載自CUP magazine 2014年7月號)

香港宣佈成立創新及科技局,近月業內及民間有不同各自表述,甚至指手劃腳!我無意「加把嘴」,不是不關心,而是嗅到太多瞎子摸象的氣圍。不是政治酬庸,就是個人經濟利益,但每人掛在口邊的總離不開一句:創新科技帶動經濟,都是想香港好啫!有些人連創新和科技也混為一體。

我是香港人,香港人有誰不想香港好啫?但現在說的是「創新」和「科技」這兩樣全世界最難理解兼惹人誤解的「怪物」,就此,如要問我會否支持成立創新及科技局?我的答案是肯定支持!原因只有一個,我指的「創新」和「科技」可能和你理解的大有不同;更且,將來創新及科技局會否對香港有所貢獻無人預計,我只是用一般升斗市民的「有好過冇」思維去下結論;反正現架構已淩亂不堪(現有的商務及經濟發展局之下有一個負責有關創新和創意事務的分科,再之下有三個叫創意香港、創新科技署和政府資訊科技總監辦公室),執執位,清洗一下現場也是件好事吧! 

創新(Innovation)的定義,網上有一大籮,在此不必贅述。從八零年代到現今,「創新」這辭早被人用濫了!我只想指出,創新背後需要的是創造力(Creativity)。而創造力是源自人腦,創新目的一定要具備積極義意的變革,包括思想、事物、過程或服務中的質變和量變,最厲害更具disruptive殺傷力。 歷史上出現過一些創新革命,都是由一些「文起八代之衰」的能人,包括在科學、藝術、經濟、商業和政治領域中的傑出人物創造出來,但徧徧全都預計不到。創新是否可複制?抑是機遇巧合,serendipitous?我相信就算飽覽全球有關發明和發現的歷史書,也不會找到答案。希望今年十月Walter Issacson出版的新書 The Innovators: How a Group of Inventors, Hackers, Geniuses, and Geeks Created the Digital Revolution中找到些端倪。

就以Google舉一個例子。Google不是第一個Search Engine軟件開發商,其他競爭對手一個一個的比下去是因為Google能「道濟天下之溺」,改寫廣告收費模式,成功把當時無議價能力的廣告客戶從傳統廣告渠道抽到網上去,一直賺錢賺到今天。先看一些數字,2003年,Google從全美報紙四百六十億美元總廣告收入只分得低於二十億美元;2012年,Google以單一獨立公司鯨吞四百三十億美元網上廣告,首次超越當年全美報紙總廣告收入三百八十六億美元。Google靠的是甚麽?只不過是一個幾美仙的pay per click 一個Quality Score 和一個Ad Rank的訂價運算Algorithm,便能滿足廣告客戶需要,凸顯交易方便和充份利用了網上Scale of Size優勢,這就是Innovation

Google是不是創立時便想到要做網上廣告賺錢?不是。Google沒有它的Search Engine能不能想到這般龐大吸金能力?不能。哪創造力從何而來?沒創造力如何創新?就算有創造力如何保證有創新?沒創新如何帶動經濟?我全不知道!只知道這不是一個甚麽「局」!「局」可作兩解:一、創新不是一「局」棋,有棋譜可背;二、創新不是任何政府架構下的甚麽「局」可以集思廣益去推動。試試看這本Imagine: how creativity works非科技書,作者Jonah Lehrer 可能啓發到你。
至 於我們常用「科技」一辭,本是「科學技術」的簡寫,但「科學技術」和「科學」根本上是同一意思,是指透過客觀方法創新研究事物存在及其相關規律。而科學 (Science)就是科學,技術(Technology)就是技術,英語只有Science and Technology, 沒有 Scientific Technology。任何操作方法可以令人實現理想目的便是技術,沒科技與非科技之分,一切甚麽古法或土法,只要work就是技 術的一種。如硬要加上科學稱之為「科技」才算高級或更有價值,我無話可說。始終到底,研獲新技術的唯一途徑只有一個,就是從前人累積經驗之上,嘗試再嘗 試,亦是牛頓最愛引用的一句Standing on the shoulders of giants!

明乎此,如果硬要把「創新」和「科技」這兩件奉為必可帶動經濟的怪物放在一起,而又能做出成績的話,問題只有一個:我們有具創造力的人才嗎?Are we creative enough?小學老師會不會鼓勵學生Out of the Box思維?第二次創作已攪得滿城風雨,塗鴉也要躲在西貢私人地方,打壓creativity到處可見,展示Creative works的空間有多大?怎配合民間科研(詳見本欄五月份〈港式R & D〉一文)?如此想下去,引伸的疑問更多!
不 過,以我有限的創造力,和對創新膚淺的了解,絕大部份胎死腹中的「創新」,無論「科技」有多先進,都是被某些金錢掛帥的思維和行政手段毒死!如果你不百分 百同意,讓我補充一點,我畢竟也是「有錢萬能,沒錢萬萬不能」信徒,一些高端「創新」的而且確必須用金錢堆砌才有機會修成正果。只不過,餘下遍地「創新」 BB,也不會是有了撥款和注資便定必破繭而出。

將來的一個甚麽局,是神是人也好,積極一點來看,如能突破多年閉關自守,繁文縟節的官僚架構,本身已算是「創新」的一種呢!(完)

不求甚解 ―― 我們真的需要電腦嗎?

(轉載自CUP magazine 2014年6月號)


很悶納,不是因為世界末日將至,只不過每天發生在香港的大小糾紛,都因是人們普遍生活取態不求甚解,散發陣陣末世風情!

電腦起過些甚麽作用?是幫兇?還是撥亂歸正的工具?

首先,我認同不求甚解是人類惰性所使然,亦非近代人所獨有;很多例子,更相反地指出,偉大發明的出發點也是人類為了省力因而催生出來!哪倘若人類真的是不求甚解,那會有電腦的出現?看起來有點矛盾,但認真地分析一下,這只是一小撮人統治大多數人的精英主義(Elitism)發展下來的自然結果。科技改寫了近代歷史,原爆就是最佳例子。而電腦,當時只限精英使用,五十多年後的今天,每人一機在手,缺之不可,亦是默默地改變我們近代文化歷史。一方面,從前只有天之嬌子才可擁有的知識和資訊,今天凡人也可垂手可拾;而另一方面,電腦令我們不自覺地沉溺在舒逸的娛樂世界,太多資訊麻木了我們的批判思維!結果把人類帶回不求甚解這惰性行為死胡同!

其實,不求甚解也是電腦的屬性!電腦只能提供答案,卻往往不能解決問題!答案(Answer)和解決方案(Solution)是最易令人混淆的兩個名辭。因為很多問題就算找出答案也不能保證找得到解決方案,而且,當一些涉及人類思想行為、經濟和政治問題時,大多沒有獨一無二的解決方案。說白了,解決問題靠的是人,不是電腦!電腦不求甚解是正常的,因為它們到今天也不會反問你為甚麽一開始會問這樣愚蠢的問題!電腦只能提供答案,而且,問錯問題電腦更絕對會給你錯的答案,即是老掉牙的所謂Garbage In Garbage Out!

那末,每天面對需要解決的問題,我們應何去何從?本來,在這末世風情陰霾下,只要我們堅持抱著拒絕不求甚解的心態,把問題簡化到最基本兩個問題:問在有生之年我們就此問題可否找到解決方案,和問找到了的解決方案是否現今最佳的。這樣地,心理上已可稍作安慰;道德上,也合乎康德《實踐理性批判》中所指純粹基於義務而不是為個人功利目的而做的行為。可惜,令我們失望的,這本該是所有立法局尊貴議員一早明白的道理,一些人還天天事事不求甚解!我已用過低智商、劣操守、見利忘義和政治徧頗等等因素嘗試「包容」他們,但我依然過不了一己道德底線。就此,我卻沒有怪普通市民不求甚解的心態,尤其是商人,因為在這社會「偽精英主義」管治下,不求甚解對市民更是一服有效的安慰劑,也是特區政府要求順民必備的屬性!商人不求甚解導致生意失敗蝕大本已是對他們最大的懲罰,而政客、局長和地鐵行政總裁不求甚解導致亂花公帑、民不聊生卻還可高薪厚祿而面無愧色,對不起,我「包容」不下!所以,我可能和一些香港納税人一樣,很悶納。 

我惟有安慰自己,近日的高鐵事件,從IT的角度反譏來看,不幸中的大幸,乃是雖然地鐵賴完地硬、再賴地軟,但由始至終沒有賴到電腦故障,軟件有毒和黑客入侵等等通常一旦金融災難發生後必用的藉口去解釋。電腦不求甚解的屬性,頗可與高官不求甚解、欲蓋彌彰的心態劃清界線了!令我憶起沒有電腦的世界,不其然再問:既然不求甚解已是人們普遍生活取態,我們真的需要電腦嗎?

回答這問題要分三層次。第一是現實層次,答案簡單直接:現今世界沒電腦絕對不行,因為一切民生已納入電腦和網絡管轄範圍,將來也是,更必然變本加厲!第二個是超現實的復古層次,答案是不需要電腦。人類歷史幾千年文化,單看「舌尖上的中國2」,那裡會有電腦?農業社會,人類累積的智慧已可裹腹温飽,你跟他們說經濟、勞動力與入息的關係、農佃資本權益和神舟十號,全是廢話!他們的家園就是世外桃源,電腦和互聯網是Aliens。我相信除地大物博的中國土地以外,地球上還有很多樂土,那些地方連內燃機也久奉,何況是電腦!更且,非洲和世界各地還存在很多貧窮飢荒的國家,活着已是恩賜,電腦可起甚麽作用?在這層次來看,我們所謂的文明,其實只是物質享樂至上,與及把經濟效益推至另一最高無尚精英主義下的統稱而已!如果一些人硬要加速這些所謂落後地方「進化」至融入現今主流價值觀,我只可嘆一聲,那是他們一廂情願的狹窄世界觀,和電腦科技無關!

再推高至第三層次,要問的是:如果時光倒流,電腦出現是必然的還是偶然的?這比較難答,但如換一角度來問:假設愛恩斯坦出生後便夭折,世上還有沒有相對論?必然的答案便呼之欲出,因為人們為滿足好奇心的欲望是永無止境,包括Intellectual和Hedonic Curiosity。沒有相對論,人類一定會有等同相對論的Symmetry and Invariance理論出現,可能不叫做相對論(事實上,研究過相對論的人都知道,相對論的中英文名字也是改錯的);沒有電腦,人類一定會有等同電腦或比現今電腦的組件更神通廣大但未命名的device出現,也許不叫Computer或電腦(況且,Computer和電腦字義上一些關係也沒有)...... 再說下去,就像Reinvent the Wheel一樣的無聊了!

到此,再問今天電腦是把人類推向不求甚解的幫兇,還是撥亂歸正的工具,倒不如在夜闌人靜的時候,我們撫心自問:每天行事,多少是康德式唯心?多少是違心?電腦,當作我們的玩物好了!反正運輸及房屋局局長和地鐵行政總裁也是如此對待我們!(完)