數(shù)十年來,Makoto Koike的母親一直都使用手工方式分揀黃瓜。如今,Makoto Koike正試圖“訓(xùn)練”出一臺(tái)機(jī)器來替代。
Makoto Koike是一名工程師,長(zhǎng)期以來,他一直愛好修補(bǔ)電子配件和機(jī)器;可以說,他不是天生就喜歡自然戶外生活的人。2014年,在Makoto Koike 33歲的時(shí)候,他離開了他長(zhǎng)期工作和生活的城市,搬到了環(huán)境優(yōu)美的靜岡縣,幫助其父母經(jīng)營(yíng)黃瓜農(nóng)場(chǎng)。“我認(rèn)為我已經(jīng)到了一定的年紀(jì)了,” Makoto Koike說道。“我想要離我的家和家人更近一些。”
Makoto Koike一家在湖西市種植黃瓜已將近五十年,他們種植了三個(gè)小型溫室的黃瓜。Makoto Koike的父親負(fù)責(zé)播種種子;Makoto Koike負(fù)責(zé)指導(dǎo)監(jiān)督他們的種植;Makoto Koike的母親則是負(fù)責(zé)對(duì)收成的果實(shí)進(jìn)行分類。在日本,最后一項(xiàng)工作尤其重要,因?yàn)檗r(nóng)作物有不同的分類標(biāo)準(zhǔn),同一個(gè)品種的黃瓜的分類就達(dá)了9種之多,這需要收割者對(duì)其農(nóng)產(chǎn)品有著非常好的識(shí)別能力,手里剛摘了一根黃瓜,你得仔細(xì)觀察它的長(zhǎng)短、粗細(xì)、顏色、紋理、是否有小刮痕、彎的還是直的、刺多不多......要跟9類標(biāo)準(zhǔn)對(duì)應(yīng),看它屬于哪一等級(jí),這并不是一個(gè)容易學(xué)的工作。Makoto Koike一家往往會(huì)把那些比較好的、筆直且厚度均勻的黃瓜給批發(fā)商,而剩余那些不太完美的黃瓜則以半價(jià)出售。一直以來,Makoto Koike的母親都是一個(gè)接一個(gè)地分揀這些蔬菜,分門別類地將它們放進(jìn)不同的箱子里。雖然她每個(gè)黃瓜只花了她半秒鐘,但這項(xiàng)工作占據(jù)了她大部分的工作時(shí)間;某些時(shí)候,她甚至在某幾天內(nèi)一天就處理了四千多根黃瓜。
Makoto Koike認(rèn)為,給黃瓜分類不應(yīng)該是瓜農(nóng)的主要的工作,瓜農(nóng)最重要的任務(wù)應(yīng)該是專注于種植出美味的黃瓜。所以他決定,要把分類的工作交給機(jī)器,但是市面上的黃瓜分類器要么性能差、要么太貴,不適合小農(nóng)場(chǎng)。在去年春天,Makoto Koike開始開發(fā)一種新的分撿黃瓜的方法,他建了一個(gè)黃瓜分揀機(jī),使用了谷歌在2015年向公眾發(fā)布的TensorFlow深度學(xué)習(xí)軟件框架。而Makoto Koike的靈感來源,部分是由他閱讀的一篇關(guān)于AlphaGo的文章,AlphaGo是有史以來第一個(gè)擊敗人類圍棋大師的計(jì)算機(jī)程序。在AlphaGo案例中,其從現(xiàn)實(shí)圍棋比賽中提取了三千萬張圖片,用于幫助確定哪種行動(dòng)步驟最有效。Makoto Koike也希望能創(chuàng)造一個(gè)類似的策略,幫助其對(duì)黃瓜進(jìn)行整理分類。
而包括深入學(xué)習(xí)的高級(jí)人工智能技術(shù)是屬于專業(yè)研究人員和軟件公司的領(lǐng)域。盡管如此,最近也有一些科技界巨頭,包括谷歌、Facebook、微軟、亞馬遜、百度以及各大學(xué)都已經(jīng)發(fā)布了免費(fèi)的開源版本的工具,使像得Makoto Koike這樣的非專業(yè)編程人員也可以對(duì)其進(jìn)行訪問。
在他的項(xiàng)目中使用了樹莓派3作為主控制器,又建立了一個(gè)自定義的照片拍攝站,這使得他能夠從三個(gè)不同角度拍攝每一根黃瓜。接著,為了分析這些圖像,把它們都傳到了TensorFlow平臺(tái)上,起初在一個(gè)小型的神經(jīng)網(wǎng)絡(luò)上運(yùn)行,以判斷是否是黃瓜,之后,已經(jīng)被判定為黃瓜的照片接著傳輸?shù)揭粋€(gè)更大的基于Linux服務(wù)器的神經(jīng)網(wǎng)絡(luò),來對(duì)黃瓜按照不同的特質(zhì)進(jìn)行分類。不過,在他能夠真正使用人工智能技術(shù)分撿黃瓜之前,Makoto Koike必須先對(duì)這套系統(tǒng)進(jìn)行“訓(xùn)練”,為了訓(xùn)練這個(gè)模型,Makoto Koike花了3個(gè)月的時(shí)間給它“喂”了7000張黃瓜照片,這些照片都是由Makoto Koike的媽媽分類貼上的標(biāo)簽。最后,他還建立了一個(gè)自動(dòng)傳送帶系統(tǒng),將每根黃瓜從照片拍攝站傳送至程序指定的箱子。
Makoto Koike在去年完成了對(duì)這套人工智能系統(tǒng)的開發(fā),而且從某種程度上來說,它確實(shí)奏效了。不過,它對(duì)黃瓜的分類準(zhǔn)確率還只能達(dá)到百分之七十,這樣的準(zhǔn)確率太低,他們還必須進(jìn)行人工檢查。而且,目前這些蔬菜還需要一個(gè)接一個(gè)的放在照片拍攝站上,也就是說,Makoto Koike的母親還沒有被“完全替代”。
Makoto Koike認(rèn)為,他所創(chuàng)造的系統(tǒng)就正是一個(gè)令人鼓舞的證明,而他目前正在研究新版本的機(jī)器,他希望新機(jī)器能夠一次分析多個(gè)黃瓜。他還計(jì)劃建立一個(gè)溫和的輸送系統(tǒng),以保護(hù)蔬菜皮膚上脆弱的皮刺,因?yàn)辄S瓜的皮刺往往被認(rèn)為是新鮮的跡象。他期望在幾年內(nèi)使其人工智能分揀機(jī)的工作效率能達(dá)到與母親一樣準(zhǔn)確,讓她能有時(shí)間做別的事情。不管怎樣,Makoto Koike說他已經(jīng)回到了湖西市。他說,“我的計(jì)劃是,今生就做個(gè)農(nóng)民。”到那個(gè)時(shí)候,農(nóng)民這份工作可能就看起來很不一樣了。
人工智能在農(nóng)業(yè)領(lǐng)域的研發(fā)及應(yīng)用早在本世紀(jì)出就已經(jīng)開始,這其中既有耕作、播種和采摘等智能機(jī)器人,也有智能探測(cè)土壤、探測(cè)病蟲害、氣候?yàn)?zāi)難預(yù)警等智能識(shí)別系統(tǒng),還有在家畜養(yǎng)殖業(yè)中使用的禽畜智能穿戴產(chǎn)品。
不過,人工智能在農(nóng)業(yè)領(lǐng)域的應(yīng)用才剛剛開始,面臨的挑戰(zhàn)比其他任何行業(yè)都要大,因?yàn)檗r(nóng)業(yè)涉及的不可知因素太多了。地理位置、周圍環(huán)境、氣候水土、病蟲害、生物多樣性、復(fù)雜的微生物環(huán)境等等,這些因素都在影響著農(nóng)作生產(chǎn)。你在一個(gè)特定環(huán)境中測(cè)試成功的算法,換一個(gè)環(huán)境未必就有用了。
我們現(xiàn)階段看到的一些人工智能成功應(yīng)用的例子大都是在特定的地理環(huán)境或者特定的種植養(yǎng)殖模式。當(dāng)外界環(huán)境變換后,如何挑戰(zhàn)算法和模型是這些人工智能公司面臨的挑戰(zhàn),這需要來自行業(yè)間以及農(nóng)學(xué)家之間更多的協(xié)作。
好文章,需要你的鼓勵(lì)
新加坡國(guó)立大學(xué)研究團(tuán)隊(duì)開發(fā)了SPIRAL框架,通過讓AI與自己對(duì)弈零和游戲來提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡(jiǎn)單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動(dòng)駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過對(duì)比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯(cuò)行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動(dòng)態(tài)稀疏性實(shí)現(xiàn)大語言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。