李涓子清華大學(xué)教授
李涓子,女,清華大學(xué)教授、清華大學(xué)人工智能研究院知識(shí)智能研究中心主任。
中文名李涓子
工作單位清華大學(xué)人工智能研究院知識(shí)智能研究中心
職務(wù)主任
性別女
榮譽(yù)記錄2020年3月19日,被教育部、國(guó)家語委授予“中國(guó)語言資源保護(hù)獎(jiǎng)”先進(jìn)個(gè)人稱號(hào)。
…………………………………………………………………………………………………………………………………………
姓名:李涓子
職稱:教授
電話:62781461
郵箱:lijuanzi@tsinghua.edu.cn
個(gè)人主頁:http://keg.cs.tsinghua.edu.cn/persons/ljz
教育背景
工學(xué)學(xué)士 (計(jì)算機(jī)科學(xué)與技術(shù)), 山西大學(xué), 中國(guó), 1986;
工學(xué)碩士 (計(jì)算機(jī)科學(xué)與技術(shù)), 山西大學(xué), 中國(guó), 1989;
工學(xué)博士 (計(jì)算機(jī)科學(xué)與技術(shù)), 清華大學(xué), 中國(guó), 2000.
社會(huì)兼職
清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系軟件研究所:黨支部書記
中國(guó)中文信息學(xué)會(huì):專委會(huì)主任
清華大學(xué)人工智能研究院:知識(shí)智能中心主任
下一次搜索聯(lián)合研究中心:執(zhí)行主任
研究領(lǐng)域
知識(shí)圖譜、新聞與社會(huì)網(wǎng)絡(luò)挖掘
研究概況
我于2000年在清華大學(xué)獲得博士學(xué)位,2001年博士后出站后留校工作至今。我的科研工作特點(diǎn)是融合語義Web、文本與社會(huì)網(wǎng)絡(luò)挖掘技術(shù),研究基于語義的內(nèi)容管理關(guān)鍵技術(shù),并應(yīng)用于包括新聞、研究者社會(huì)網(wǎng)絡(luò)和Web服務(wù)在內(nèi)的多個(gè)領(lǐng)域。主要工作包括:
1. 基于語義的內(nèi)容管理關(guān)鍵技術(shù)。在本體映射研究中,提出基于貝葉斯決策的多策略本體映射模型,解決了多種映射策略的融合問題;提出動(dòng)態(tài)選擇的多策略本體映射模型,解決了針對(duì)不同本體映射任務(wù),動(dòng)態(tài)選擇映射策略的問題,并進(jìn)一步提高了映射精度。研究成果發(fā)表在SIGMOD、Journal of Web Semantics(JoWS)和TKDE等國(guó)際重要學(xué)術(shù)期刊和會(huì)議上 。據(jù)Google Scholar統(tǒng)計(jì),發(fā)表在JoWS上的論文被引用73次。在語義標(biāo)注研究中,針對(duì)標(biāo)注對(duì)象所具有的不同特點(diǎn),研究不同的語義標(biāo)注方法,提出基于規(guī)則、分類模型和序列模型的條件隨機(jī)場(chǎng)的三類語義標(biāo)注方法。這些標(biāo)注方法已經(jīng)成功應(yīng)用于研究者個(gè)人信息、會(huì)議信息和公司信息的語義標(biāo)注中,取得了良好的應(yīng)用效果。上述研究工作得到國(guó)家自然科學(xué)基金和973項(xiàng)目的支持。
2. 新聞與社會(huì)網(wǎng)絡(luò)挖掘。在新聞挖掘中,提出基于索引樹和命名實(shí)體的話題發(fā)現(xiàn)和跟蹤模型、基于話題的新聞分析模型,研究成果發(fā)表在SIGIR 2007,并在SIGKDD 2009上做demo演示;在社會(huì)網(wǎng)絡(luò)挖掘研究中,提出面向?qū)<业难芯空呱鐣?huì)網(wǎng)絡(luò)搜索模型,并對(duì)專家發(fā)現(xiàn)、研究興趣發(fā)現(xiàn)和會(huì)議挖掘等問題進(jìn)行了深入研究。
3. 新聞?lì)I(lǐng)域XML數(shù)據(jù)處理應(yīng)用研究。我是國(guó)家標(biāo)準(zhǔn) “中文新聞信息標(biāo)識(shí)語言(CNML)”(GB/T20092-2006)的第四起草人,并作為項(xiàng)目負(fù)責(zé)人,承擔(dān)了CNML標(biāo)準(zhǔn)管理系統(tǒng)的研制任務(wù)。目前,該軟件部署在新華社文字編輯系統(tǒng)、圖片編輯系統(tǒng)、信息部多媒體編輯系統(tǒng)、多媒體數(shù)據(jù)庫、視音頻編輯系統(tǒng)、產(chǎn)品生成系統(tǒng)等重要業(yè)務(wù)系統(tǒng)中,全面滿足了技術(shù)建設(shè)和日常運(yùn)維的需求。該項(xiàng)目獲得“2009年王選新聞科學(xué)技術(shù)進(jìn)步二等獎(jiǎng)”。
研究課題
國(guó)家重點(diǎn)研發(fā)計(jì)劃:融合大數(shù)據(jù)與人類常識(shí)的開放域多語言知識(shí)圖譜構(gòu)建(2018-2021)
國(guó)家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃(973計(jì)劃):融合三元空間的中文語言知識(shí)與世界知識(shí)獲取和組織(2014-2018)
國(guó)家自然科學(xué)基金項(xiàng)目:面向大規(guī)模多源數(shù)據(jù)的人物畫像和定位分析關(guān)鍵技術(shù)(2018-2021)
國(guó)家自然科學(xué)基金項(xiàng)目:大規(guī)模知識(shí)關(guān)聯(lián)和文本語義計(jì)算方法及應(yīng)用驗(yàn)證(2016-2020)
國(guó)家自然科學(xué)基金項(xiàng)目:多語言多模態(tài)知識(shí)圖譜關(guān)鍵技術(shù)研究及其應(yīng)用(2017-2019)
國(guó)家自然科學(xué)基金項(xiàng)目: 大規(guī)模動(dòng)態(tài)本體映射模型研究 (2010-2012)
獎(jiǎng)勵(lì)與榮譽(yù)
2017年北京市科技進(jìn)步一等獎(jiǎng)
2013年人工智能學(xué)會(huì)科技創(chuàng)新一等獎(jiǎng)
2013年電子學(xué)會(huì)自然科學(xué)二等獎(jiǎng)
2011年王選新聞科學(xué)技術(shù)進(jìn)步獎(jiǎng)一等獎(jiǎng)
學(xué)術(shù)成果
[1] 《Mining User Generated Content》
[2] 《Semantic Mining in Social Networks》
[3] Jiaxin Shi, Lei Hou, Juanzi Li, Zhiyuan Liu, Hanwang Zhang: Learning to Embed Sentences Using Attentive Recursive Trees. AAAI (2019)
[4] Jiaxin Shi, Chen Liang, Lei Hou, Juanzi Li, Zhiyuan Liu, Hanwang Zhang:
DeepChannel: Salience Estimation by Contrastive Learning for Extractive Document Summarization. AAAI(2019)
[5] Jiaxin Shi, Hanwang Zhang, Juanzi Li:Explainable and Explicit Visual Reasoning over Scene Graphs. CVPR(2019)
[6] Hailong Jin, Lei Hou, Juanzi Li, Tiansi Dong: Attributed and Predictive Entity Embedding for Fine-Grained Entity Typing in Knowledge Bases. COLING 2018: 282-292(2018)
[7] Yixin Cao, Lei Hou, Juanzi Li, Zhiyuan Liu:Neural Collective Entity Linking. COLING 2018: 675-686(2018)
[8] Yixin Cao, Lei Hou, Juanzi Li, Zhiyuan Liu, Chengjiang Li, Xu Chen, Tiansi Dong:Joint Representation Learning of Cross-lingual Words and Entities via Attentive Distant Supervision. EMNLP 2018: 227-237(2018)
[9] Xin Lv, Lei Hou, Juanzi Li, Zhiyuan Liu:
Differentiating Concepts and Instances for Knowledge Graph Embedding. EMNLP 2018: 1971-1979(2018)
[10] Jiangtao Zhang, Juanzi Li, Xiao-Li Li, Yixin Cao, Lei Hou, Shuai Wang: Is a Common Phrase an Entity Mention or Not? Dual Representations for Domain-Specific Named Entity Recognition. DASFAA (1) 2018: 830-846(2018)
[11] Jing Zhang, Jie Tang, Yuanyi Zhong, Yuchen Mo, Juanzi Li, Guojie Song, Wendy Hall, Jimeng Sun:StructInf: Mining Structural Influence from Social Streams. AAAI 2017: 73-80(2017)
[12] Linmei Hu, Juanzi Li, Liqiang Nie, Xiaoli Li, Chao Shao: What Happens Next? Future Subevent Prediction Using Contextual Hierarchical LSTM. AAAI 2017: 3450-3456(2017)
[13] Liangming Pan, Chengjiang Li, Juanzi Li, Jie Tang: Prerequisite Relation Learning for Concepts in MOOCs. ACL (1) 2017: 1447-1456(2017)
[14] Yixin Cao, Lifu Huang, Heng Ji, Xu Chen, Juanzi Li: Bridge Text and Knowledge by Learning Multi-Prototype Entity Mention Embedding. ACL (1) 2017: 1623-1633(2017)
[15] Yan Zhang, Thomas Paradis, Lei Hou, Juanzi Li, Jing Zhang, Haitao Zheng: Cross-Lingual Infobox Alignment in Wikipedia Using Entity-Attribute Factor Graph. International Semantic Web Conference (1) 2017: 745-760(2017)
[16] Jing Zhang, Jie Tang, Cong Ma, Hanghang Tong, Yu Jing, Juanzi Li, Walter Luyten, and Marie-Francine Moens. Fast and Flexible Top-k Similarity Search on Large Networks. ACM Transactions on Information Systems (TOIS), 2017, Volume 36, Issue 2, Article No. 13. (if =1.3) [PDF]
[17] Linmei Hu, Bin Zhang, Lei Hou, Juanzi Li:Adaptive online event detection in news streams. Knowl.-Based Syst. 138: 105-112 (2017)
[18] Lei Hou, Juanzi Li, Xiao-Li Li, Jie Tang, and Xiaofei Guo. Learning to Align Comments to News Topics. ACM Transactions on Information Systems (TOIS), 2017, Volume 36, Issue 1. (if =1.3) [PDF]