糯米文學吧

計算機虛擬現實交互技術應用

能搞定“熊孩子”的兒童陪伴機器人不僅要有耐心,還得有超高智商,這樣才能夠讓家人在户外瘋狂狩獵“寵物小精靈”時,告訴它什麼才是真正的“黑科技”。 一個更加性感的時代已經來臨,“黑科技”,歡迎你來到地球。

計算機虛擬現實交互技術應用

  口袋妖怪萌寵大於智能AR和LBS證明了自己的應用價值

最近一段時間,一款名為《口袋妖怪GO》(Pokemon Go)的遊戲讓全球玩家陷入了一種瘋狂。遊戲中的探索真實世界和抓寵的功能讓紐約時代廣場前聚集大量玩家。因為使用了目前最流行的AR(增強現實)和LBS(地理定位)技術,《口袋妖怪GO》也被冠以“黑科技”遊戲。

《口袋妖怪GO》的黑科技到底有多酷炫?或許,會賣萌才是最關鍵的因素。西山居世遊運營總監趙強對北京晨報記者表示,Pokemon Go所使用的AR+LBS技術已經出現了幾十年,這款遊戲之所以火爆,並非採用了很多高深莫測的“黑科技”,最主要的原因,還是其開發公司任天堂20年來對口袋妖怪這一IP的持續培養,讓它在全世界範圍內具有廣泛的用户基礎。 當然,AR和LBS技術也的確為這一遊戲IP起到錦上添花的作用。趙強表示,AR技術被稱為增強現實,是一種可以實時地計算攝影機影像的位置及角度,並將虛擬圖像、視頻和3D模型與現實世界疊加在一起進行交互的計算機技術,“這種技術早在1990年就被提出,1998年開始由Sportvision公司用於實況橄欖球直播。” 而LBS和遊戲的結合更加不是新鮮事,自上世紀90年代該技術出現後,2000年的《尋寶遊戲》可以讓玩家通過真實GPS座標尋找祕密寶藏。2004年,《I Love Bees》通過將玩家派送到各個GPS座標的玩法同樣採用了該技術。 “《Pokemon Go》讓AR與LBS技術突然火起來,不是因為它是什麼黑科技,而是此前受到的關注太少。現在它們終於證明了自己的應用價值。”

360機器人陪伴孩子大白離我們只有899元的距離 “大白”正在走進我們的生活,它離我們只有899元的距離。

上週,360兒童機器人巴迪正式推出。在人工智能“黑科技”的快速推進下,曾經科幻電影裏的機器人場景正飛入尋常百姓家。

別看它外表呆萌可愛,這是個會思考的兒童陪伴機器人。360智能家庭總裁鄧邱偉介紹了裏面的黑科技:採用語音控制技術,精準的語義分析讓其能夠快速準確理解孩子的意圖;獨有的K故事功能,即使父母不在身邊,孩子也能通過巴迪機器人聽到爸爸媽媽講的故事。

此外,父母還可以通過360兒童機器人與孩子視頻通話,也能隨時監控家中場景,當孩子在機器人前停留時,機器人會自動抓拍小視頻,保留孩子的精彩瞬間。

鄧邱偉説,人工智能是其中最核心的技術。聽上去簡單的對話,背後有豐富的數據支持和語音喚醒、語音識別、語意理解的支持。360還聯合國內知名兒童內容廠商,為兒童機器人量身定製了海量優質的兒童早教資源。“把我們所擁有的資源全部整合起來。”

“我們想讓人們真正把它用起來,至於未來的盈利模式有很大的想象空間。”在鄧邱偉的設想中,巴迪就是一個可愛的.大白,很體貼、很温馨,能夠解決小朋友的問題。

  百度AI能識圖作曲“科技和藝術的跨界很性感”

欣賞徐悲鴻的《奔馬圖》時搭配激情澎湃的音樂,品味梵高的《星夜》時是舒緩又寂靜的音符。如今,機器已經可以學會理解畫作的情緒,並譜寫出適宜的音符。

日前,百度在“AI科技與藝術之夜”活動上展現了人工智能譜曲,並將多位藝術大師的畫作用音樂的形式表現,實現了視覺呈現向聽覺表達的轉化。

百度此次展示的人工智能看圖譜曲技術,是通過其全球最大規模的神經網絡和深度學習算法由機器自主學習實現。

百度神經網絡在“看到”圖像後,首先對圖像進行分析解讀,為圖像打上若干具象化的標籤。例如提取圖片中出現的高山、天空、寵物等物體,以及色調想要表達的意境。然後通過搜索挖掘相關的音樂信息,對音樂拆分重組,再合成與圖片內容相匹配的音樂旋律,最終拼接成完整的曲子。

“科技和藝術的跨界很性感。百度一直嘗試用技術解決各種問題,人工智能識圖作曲技術,實現了所閲即所樂。”百度項目負責人對北京晨報記者表示。

目前,全球範圍內能夠實現人工智能自動譜曲的僅有百度和谷歌,而百度嘗試將圖像所體現的情感“移情”轉變為帶有聲音信息的技術則更為複雜。

人工智能識圖作曲並不是一項停留在實驗室中的作品。百度項目負責人告訴北京晨報記者,通過這種方式可以讓神經網絡更好地理解人的意圖,更好地為人類服務。

例如對於視障人士來説,這項技術可以幫助他們更好地理解眼前的作品。對於一些特殊人羣,這項技術或許也可以應用於心理疾病等輔助治療等方面。

多年以來,百度給外界的印象一直都是高科技公司。但近年來包括無人車、張國榮語音合成、尼泊爾古蹟修復、度祕等貼近生活的技術展示,讓外界對這家科技公司的印象有所轉變,因此其中不少技術也被網友稱為“黑科技”。

  搜狗突破語音識別最後3%

  “語音識別是有大腦的”

在日前召開的極客公園創新者峯會上,搜狗展示了最新的語音識別技術,現場將搜狗公司CEO王小川的現場發言實時翻譯成滾動字幕,準確率高達97%以上。

此外,王小川還現場演示了最新推出的語音修改功能,能夠聽懂自然語言糾錯信息並進行修改,例如“弓長張改成立早章”,“女字旁的她”等複雜口令。“這項技術解決了語音識別準確率最後3%的差距。”王小川表示。

搜狗語音交互技術中心負責人王硯峯告訴北京晨報記者,支撐這些技術背後的,一方面是語音識別本身的能力,另一方面,就是強大的語義理解能力。“市場上的語音識別功能只有耳朵沒有大腦,只能聽到有什麼樣的字,卻聽不懂其中的意思。”

王硯峯表示,搜狗語音識別有“大腦”,這個“大腦”就是語義理解引擎,將語音識別和對內容的理解綁定在一起,做到真正理解用户的語義。機器對“弓長張”與“立早章”的理解,背後是搜狗龐大的漢字知識庫加海量用户文字表達數據,以及搜狗的深度學習技術在海量用户數據上的信息挖掘能力。

王硯峯認為,交互技術的發展和更智能的搜索體驗將會是引領未來的“黑科技”,也是搜狗一直努力的方向。