我院教師參加CCF-AI走進高校報告會

發布者:williamhill威廉希尔官网發布時間:2017-11-22浏覽次數:879

    本網訊(通訊員葉雪軍)1118日,我院教師李晶晶、葉雪軍、王婷、邱月收到中國地質大學蔣良孝教授的邀請,參加了中國計算機學會人工智能與模式識别專委會CCF-AI走進高校報告會,報告會主題是“數據挖掘與機器學習”。數據挖掘與機器學習已廣泛應用于各個學科領域(如計算機科學與技術、信息管理與信息系統、應用數學與統計、自動化過程與控制等)。數據挖掘是指從大量數據中提取知識,機器學習則是指利用經驗來改善計算機系統自身的性能。數據挖掘可以視為機器學習和數據庫的交叉,它主要利用機器學習界提供的技術來分析數據,利用數據庫界提供的技術來管理數據。數據挖掘是面向挖掘的任務,而機器學習是面向學習的技術,二者既有區别又有聯系。

報告會特邀天津大學計算機學院胡清華教授介紹了“考慮數據分布特性的機器學習算法”,随着機器學習面對的數據規模不斷擴大,如何針對數據的特性設計相應的學習算法變得越來越重要,數據在特征空間的概率分布信息是設計學習算法的重要信息,但遺憾的是很難獲得高維空間中樣本的統計分布,但數據在特征空間、類别上以及建模殘差的某些弱統計信息還是可以通過數據提取的。在報告中簡要介紹如何獲取此類信息,并在分類、回歸和數據量化學習中如何融入數據的分布信息。

北京交通大學計算機學院于劍教授會上介紹了“機器學習:從公理到算法”。在大數據時代,因應用需求的驅動,大量新機器學習方法不斷産生,這些新算法理論依據各異,彼此之間的關系及其複雜,對使用者要求極高。但是,兒童的學習能力極高,卻不能掌握現今機器學習的理論。是否能夠提出一套符合人類認知的機器學習理論,是當前一個亟待解決的問題。本次報告将提出一個統一基于認知的機器學習公理化框架,其基本假設是:歸哪類,像哪類;像哪類,歸哪類。該公理框架可以推演出歸類方法的三條設計原則,以統一的方式重新解釋了數據降維、密度估計、回歸、聚類和分類等問題,而且與日常生活中的認知原則一緻。

東南大學計算機科學與工程學院耿新教授會上介紹了“機器學習中的标記分布和标記增強”。許多機器學習任務都可以泛化為對給定的示例預測不同标記的描述度,而所有标記對一個示例的描述度構成該示例的标記分布,在以标記分布标注的數據集中學習的過程稱為标記分布學習。現實世界中存在不少本身就具有标記分布信息的數據,而更多情況下,标記分布信息不完整時,可以通過先驗知識或者機器學習方法生成完整的标記分布,這一過程稱為标記增強。标記分布學習方法配合标記增強發放能夠有效匹配大多數有監督學習問題,具有廣泛的應用前景。

通過積極參與本次學術活動,我院教師充分體驗了從重在模式創新的“互聯網+”到技術創新的“智能+”時代,利用機器學習及深度學習等人工智能技術,深度挖掘并充分利用大數據的價值,實現更精準分析的一系列應用。通過參加數據挖掘與機器學習學科專業領域的學術交流,促進本領域學者間的了解與合作,激發并永葆青年學者的科研激情,快速提升青年學者的學術水平。