如今,人工智能大模型正加速走進我們的日常生活,為人們的生活帶來便利。
總臺記者來到杭州富陽經(jīng)濟技術(shù)開發(fā)區(qū),認識了一支特殊的創(chuàng)業(yè)團隊。他們正在用AI技術(shù),幫視障者解決生活上的難題。通過人工智能讓視障者“感知”世界,正是這個眼鏡研發(fā)團隊的初心,也是人工智能大模型惠及民生、賦能千行百業(yè)的生動縮影。
這位戴著眼鏡的女孩叫蔡瓊卉,她七歲意外失明,她的指尖能精準拿捏鋼琴八千八百多個零件,可出門后的十米陌生距離,卻常讓她迷茫。

今年,小蔡有個新年愿望,就是能獨立出門參加新春音樂會。為幫她圓夢,研發(fā)人員全力攻關(guān)AI眼鏡的避障功能。團隊用大半年時間走遍城市街巷,采集斑馬線、臺階、障礙物等各種路況信息訓練AI。除了能識別路況,更要提醒得夠快。團隊反復打磨,將眼鏡避障反應(yīng)時間從500毫秒“死磕”到300毫秒。

記者體驗發(fā)現(xiàn),眼鏡雖能及時提示障礙、指引方向,但黑暗中的每一步還是如履薄冰。為測試性能,團隊成員都曾戴著眼罩反復實測,也正是這份感同身受,讓團隊更清楚該往哪兒使勁。

蔡瓊卉的夢想,不僅是能到達目的地,更是能像普通人一樣生活。
借助圖像解析與場景理解能力,AI眼鏡能實時識別菜單和周圍環(huán)境,轉(zhuǎn)化為語音,讀給視障者聽。這一暖心功能的實現(xiàn),正是依托國產(chǎn)人工智能大模型的支撐。

阿里云千問大模型業(yè)務(wù)總經(jīng)理 徐棟:大模型一定程度上是像人一樣去跟環(huán)境互動的,所以,對于殘障人士等需要幫助的群體而言,大模型可以變成他們的眼睛,變成他們的嘴巴、變成他們的耳朵,他的生活質(zhì)量也會得到提升。

瞳行科技技術(shù)總監(jiān) 張力:千問這個大模型,它就是像知識比較豐富的一個大學生。我們在這個基礎(chǔ)上,再給它輸入一些盲人相關(guān)領(lǐng)域的知識,讓它更適配應(yīng)用場景。如果自研這個識別大模型,中小企業(yè)是不太可能投入太多精力去做這個事情的,這個研發(fā)成本非常高。

大模型的開放共享,讓AI助盲眼鏡的研發(fā)之路走得更快、更穩(wěn),也讓蔡瓊卉的出行夢,離現(xiàn)實越來越近。

所有的努力,終會迎來花開。新春之際,在研發(fā)人員默默保護下,蔡瓊卉戴著歷經(jīng)無數(shù)次測試、反復優(yōu)化的AI助盲眼鏡,終于獨自走過了陌生的街道,自信地走向舞臺。

聚光燈下的蔡瓊卉,終于實現(xiàn)了自己的新春心愿。而舞臺背后,是研發(fā)團隊在街頭巷尾無數(shù)次測試,是技術(shù)與初心的雙向奔赴,是中國AI以最柔軟的方式,托舉起平凡人的夢想。

瞳行科技創(chuàng)始人 汪建軍:能幫他們“從不可能變成可能”,陪著他們走得更遠,是我們努力的意義,也是科技發(fā)展的意義。

開源的人工智能大模型正在落地生根,從實驗室的算法打磨,到千行百業(yè)的民生落地,中國AI創(chuàng)新跑出的,不僅是技術(shù)迭代的速度,更是溫暖人心的溫度。
(總臺央視記者 王琰 岳群 朱江 王世玉 宋文瑾)