江南大學吳小俊:大數據運用需要簡單高效 不要濫用
【本站智能訊9月12日消息】今天,由中國人工智能學會主辦,本站科技、本站智能、本站本地、江南大學等共同承辦的“人工智能高峰論壇”在無錫華邑酒店正式開啓。會上,江南大學博導、科研院院長吳小俊先生做了主題爲《大數據時代的人工智能:人工智能的發展是否存在侷限》的演講。
吳小俊稱,我們每天都面臨大量的不同的數據,這個數據量的增長速度也非常快,事實上我們對大數據的理解,無論是政府還是學術界,大數據事實上在中國某程度上存在被濫用的現象。大數據非常的複雜,它所面臨的挑戰也會非常多。大數據給了我們挑戰的同時,事實上也給了我們很多的機遇。
在吳小俊看來,大數據和人工智能,讓我們面臨一個非常矛盾的問題,一方面我們的數據量大、複雜,數據的關聯,深度學習是非常複雜的模型,這種大的模型得到了非常令人驚喜的效果,比如說AlphaGo,還有翻譯系統,這都是深入學習帶給我們的新變化,但是這兩者事實上是有一些矛盾的,因此學術界最近正在向這兩者融合,如何找到既簡單又很高效的大數據處理方法?我想,人和機器協同工作,會使得我們大數據的問題得到解決。
吳小俊稱,人工智能的主要技術都可以在物聯網當中得到很好的應用。有人認爲,聚類對我們大數據的分析非常重要,因爲我們的大數據當中大部分數據都沒有標籤的支持。當然這個聚類分析既是一個老話題又是一個新話題,因爲面對我們的大數據聚類實際上非常複雜,我們很難解決。“如果認爲現在的大數據的聚類方法跟過去是一樣的,那是一個大的錯誤。我們會有一些新的方法和要求,比如說我們用了一些分佈式的算法,我們還可以對大數據進行適當的分類。”吳小俊說到。
對於人工智能的發展,吳小俊通過對近年來的一些人工智能的期刊和會議做了一些歸納和分析,發現現在很多主流的人工智能期刊的會議都被深度學習給霸佔了,所以使得做原來一些傳統研究的人無所適從。深度學習需要海量的計算資源,如何得到比較簡捷的資源呢?如何得到更好的模型呢?這將是未來一個很好的方向。
吳小俊稱,大數據的人工智能有很多視角,今天我僅僅是給出了非常有限的視角。現在這種簡單暴力的模擬事實上是離我們完整的模擬和超越還有非常多的路要走,深度學習應該說也不是人工智能發展的唯一——比如說有人最近提出了寬度學習這樣的問題。
吳小俊說到,愛因斯坦曾經說過,他說任何事情都是越簡單越好,直到不能更簡單。我們在尋找大數據挖掘發展的時候既要找到簡單,同時也要有效的方法。
據悉,吳小俊從事模式識別與人工智能方面的研究,主持國家精品課程《人工智能概論》和國家雙語示範課程《人工智能》的建設工作。(易智)
以下爲吳小俊教授演講實錄:
吳小俊:謝謝主持人對我的介紹,我來自江南大學。大家都知道在大數據我們有很多的機遇,比如說美國的智慧地球、聯合國的全球大數據脈動以及我們中國提出來的感知中國,實際上這都會給我們的大數據提供很多的機遇。所以我今天主要談一談大數據當中人工智能的一些思想,以及通過大數據時代下人工智能的若干視角,對人工智能未來的走向做一些判斷。
我這個PPT是臨時做的,所以非常不好意思。因爲我考慮到今天有部分國外的嘉賓,所以我也採用了中英結合的方式來介紹。
比如說我們每天都面臨大量的不同的數據,這個數據量的增長速度也非常快,事實上我們對大數據的理解,無論是政府還是學術界,大數據事實上在中國大陸也是有一定被濫用的。大數據非常的複雜,如果說用現有的工具能夠解決的話就不叫大數據了,所以事實上它的挑戰是會非常多的。大數據給了我們挑戰的同時,事實上也給了我們很多的機遇。世界上主流的媒體都對大數據給予了很大的關心,都進行了關注。在面向大數據時代的人工智能,主要是說我們有沒有一些新的方法來處理大數據。實際上我們面對大數據、人工智能,我們面臨一個非常矛盾的問題,一方面我們的數據量大、複雜、數據的關聯,深度學習是非常複雜的模型,這種大的模型得到了非常令人驚喜的效果,比如說AlphaGo還有翻譯系統,這都是深入學習帶給我們的新變化,但是這兩者事實上是有一些矛盾的,因此學術界最近正在向這兩者融合,如何找到既簡單又很高效的大數據處理方法。如果說你沒有領域的知識,沒有辦法來處理大數據。包括大數據的數據資源比較豐富,但是因爲太大了,所以會帶來一些新的挑戰,人和機器是協同工作,今後會一起工作,使得我們大數據的問題得到解決。
我下面將從物聯網、大數據的聚類、深度學習還有我們大家關心的人臉識別四個維度來解讀一下我們大數據人工智能的新趨勢。比如說我們大家關心的物聯網,比如說我們的智能家居、智慧醫療、無人駕駛,這個地方有很多的人工智能問題,我們的物聯網掀起了新的技術的革命和挑戰,這個當中大數據、人工智能就是新的技術。在物聯網當中的人工智能技術可以說無處不在,我們人工智能的主要技術都可以在物聯網當中得到很好的應用。因爲這個數據量非常大,我們如何進行分析呢?可能聚類是一個很好的方法,所以有人就給出了一個很好的觀點,就是說聚類對我們大數據的分析非常重要,因爲我們的大數據當中大部分數據都沒有標籤的支持。當然這個聚類分析既是一個老話題又是一個新話題,因爲面對我們的大數據聚類實際上非常複雜,我們很難解決。如果說我們面對我們幾百個聚類分析的算法,如果說認爲現在的大數據的聚類方法跟過去是一樣的,是一個大的錯誤。
我們會有一些新的方法和要求,比如說我們用了一些分佈式的算法,我們還可以對大數據進行適當的分類。大家知道智慧城市涉及到非常多的數據,最主要的是如何爲我們的市民、民生服務,這些大數據問題怎麼辦?這是我們遇到的一些挑戰。比如說最近我們在做一些智慧醫療方面的數據處理,因爲在醫療系統當中大家可以看到到醫院去醫生先不給你看病,先叫你做各種各樣的檢查,做了各種各樣的檢查以後再對各類數據進行分析。大家都知道現在的深度學習,我們也在研究深度學習,深度學習實際上是對我們大腦的一個很簡單的模擬,我這個地方給出了一些我的理解和觀察。比如說在深度學習當中最重要的模型就是CNN,這是一個保障,這個保障目前爲止全世界的人都在挖這個金礦,每個人挖到的東西是不一樣的,這方面我們也在做。這是我們江南大學的圖象美景,我們運用深度學習來表示,這個方面很有意思。
我對近年來的一些人工智能的期刊和會議做了一些歸納和分析,發現現在很多主流的人工智能期刊的會議都被深度學習給霸佔住了,所以使得搞原來一些傳統研究的人無所適從。我們總結一下深度學習的方向是什麼,因爲它需要海量的計算資源,如何得到比較簡捷的資源呢?如何得到更好的模型呢?這將是未來一個很好的方向,我們也在裡面做了一些工作。最後是講人臉識別,在這方面我們也有遇到一些挑戰,比如說姿態、光照、遮擋、表情、模糊、低分辨率的問題等等。我們面對這樣的一些問題提出了一些方法,也就是說我們把深度學習、神經網絡做了相關工作,同時我們把從深度學習當中獲得的一些營養元素,我們對人臉的支撐做了一些研究,也得到了一些結果。有一個結果是這樣的,比如說我們今年在夏威夷的一個全世界的競賽當中我們獲得了全世界第四名,我們的方法是唯一沒有用深度學習的方法,這是感到振奮的。這個方面我們事實上還有一些其他的工作,我的學生和同事們在這個方面做了一些初步的工作,時間關係我就不一一介紹了。
對於大數據的人工智能,我們遇到的挑戰是很多的,比如說這個圖象怎麼用機器來理解?比如說這個褲子有幾條腿,簡單來看是3條腿,但是我們人通常是幾條腿呢?我們是2條腿,所以這些方面我們遇到很多的挑戰。還有比如說這個上面有幾個臺階,這個圖當中有幾個人,你讓任何一個現在最好的計算機算法來做都做不好,所以這個方面我們遇到的挑戰是非常多的。人工智能的發現是否會存在極限呢?
這是一些主要的觀點,最後我做一個簡單的總結。大數據事實上從研究來看,應該說纔剛剛開始,我們面對的挑戰非常多。不是說業界的聲音越大這個技術就越成熟了,事實上我們遇到了很多的挑戰。大數據的人工智能有很多視角,今天我僅僅是給出了非常有限的視角。現在這種簡單暴力的模擬事實上是離我們完整的模擬和超越還有非常多的路要走,深度學習應該說也不是人工智能發展的唯一。比如說有人最近提出了寬度學習這樣的問題。
最後用愛因斯坦的一句話,他說任何事情都是越簡單越好,但是不能再簡單。我們在尋找大數據挖掘發展的時候既要找到簡單,同時也要有效的方法。非常感謝本站給了我這樣一個機會向大家分享,謝謝大家。(完)