圖片分享社交平臺Pinterest周一宣布,其已收購了圖像識別及視覺搜索技術(shù)初創(chuàng)企業(yè)VisualGraph。
圖:VisualGraph的圖片識別技術(shù)可檢測到人臉、身體、汽車及其他物體
VisualGraph成立于2013年,VisualGraph公司為一家二人公司,兩名員工分別為Kevin Jing和David Liu,其中前者曾為谷歌前員工。VisualGraph的圖片識別技術(shù)可識別圖片上人臉、汽車、服裝、紋理圖案及人體的體貌特征。對于Pinterest來說,收購VisualGraph技術(shù)能夠幫助Pinterest將用戶貼圖分門別類;反之,VisualGraph技術(shù)可幫助用戶實(shí)現(xiàn)圖片的精準(zhǔn)搜索。
Pinterest的這一并購交易實(shí)為獲得VisualGraph技術(shù)和人才。未來Kevin Jing和David Liu將加入到Pinterest的工程師團(tuán)隊(duì),其中Kevin Jing將加入到Pinterest新的“視覺發(fā)現(xiàn)”團(tuán)隊(duì)。
Kevin Jing和David Liu在一份聲明中表示:“我們感到十分激動(dòng),未來將有機(jī)會(huì)把機(jī)器視覺與人類視覺結(jié)合,創(chuàng)造兼具審美和實(shí)用功能的視覺發(fā)現(xiàn)體驗(yàn)。”
Pinterest公司一位發(fā)言人稱:“收購VisualGraph將有助于我們創(chuàng)建方便用戶使用理解圖片的技術(shù)。通過創(chuàng)建新技術(shù),希望用戶更加便捷的找到他們所喜歡的東西。”Pinterest發(fā)言人還稱,VisualGraph已關(guān)閉了其原有向少數(shù)人開放的服務(wù)。
好文章,需要你的鼓勵(lì)
北航團(tuán)隊(duì)推出Easy Dataset框架,通過直觀的圖形界面和角色驅(qū)動(dòng)的生成方法,讓普通用戶能夠輕松將各種格式文檔轉(zhuǎn)換為高質(zhì)量的AI訓(xùn)練數(shù)據(jù)。該工具集成了智能文檔解析、混合分塊策略和個(gè)性化問答生成功能,在金融領(lǐng)域?qū)嶒?yàn)中顯著提升了AI模型的專業(yè)表現(xiàn),同時(shí)保持通用能力。項(xiàng)目已開源并獲得超過9000顆GitHub星標(biāo)。
盧森堡計(jì)算機(jī)事件響應(yīng)中心開發(fā)的VLAI系統(tǒng),基于RoBERTa模型,能夠通過閱讀漏洞描述自動(dòng)判斷危險(xiǎn)等級。該系統(tǒng)在60萬個(gè)真實(shí)漏洞數(shù)據(jù)上訓(xùn)練,準(zhǔn)確率達(dá)82.8%,已集成到實(shí)際安全服務(wù)中。研究采用開源方式,為網(wǎng)絡(luò)安全專家提供快速漏洞風(fēng)險(xiǎn)評估工具,有效解決了官方評分發(fā)布前的安全決策難題。
中國電信研究院等機(jī)構(gòu)聯(lián)合開發(fā)的xVerify系統(tǒng),專門解決復(fù)雜AI推理模型的評估難題。該系統(tǒng)能夠準(zhǔn)確判斷包含多步推理過程的AI輸出,在準(zhǔn)確率和效率方面均超越現(xiàn)有方法,為AI評估領(lǐng)域提供了重要突破。
昆侖公司Skywork AI團(tuán)隊(duì)開發(fā)的Skywork R1V模型,成功將文本推理能力擴(kuò)展到視覺領(lǐng)域。該模型僅用380億參數(shù)就實(shí)現(xiàn)了與大型閉源模型相媲美的多模態(tài)推理性能,在MMMU測試中達(dá)到69.0分,在MathVista獲得67.5分,同時(shí)保持了優(yōu)秀的文本推理能力。研究團(tuán)隊(duì)采用高效的多模態(tài)遷移、混合優(yōu)化框架和自適應(yīng)推理鏈蒸餾三項(xiàng)核心技術(shù),成功實(shí)現(xiàn)了視覺理解與邏輯推理的完美結(jié)合,并將所有代碼和權(quán)重完全開源。