基本信息
姓名:巫思杏
职称:讲师
系所:人工智能系
研究领域:自然语言处理、人工智能
电子邮箱:wusixing@ynu.edu.cn
更新日期:2023年2月
巫思杏,1993年出生,云南昆明人,计算机软件与理论理学博士。2015年本科毕业于9968新浦京官网软件工程专业,获得工学学士学位,并于同年考研进入北京大学,师从李影教授和吴中海教授。随后,于2018年在北京大学软件与微电子学院获得软件工程专业工程硕士学位,于2022年在北京大学计算机学院获得计算机软件与理论专业理学博士学位。主要研究方向是自然语言处理,具体包含开放域对话生成、文本生成、多源知识融合等研究任务。 共计发表20余篇(国际学术论文并获得一项发明专利,其中13篇一作文章发表在自然语言顶级会议(ACL、EMNLP、COLING),人工智能顶级会议(IJCAI),数据挖掘顶级会议(WSDM),对话语音交互顶级会议/Trans期刊(ICASSP , ITASLP),另外2篇文章发表于CCF-C类会议。近年来,连续受邀参与IJCAI、ACL、EMNLP、AAAI、NLPCC等国内外顶级会议的审稿工作。
教育背景
2011.09-2015.07 9968新浦京官网 9968新浦京官网,软件工程,本科
2015.09-2018.07 北京大学 软件与微电子学院,软件工程,硕士 (导师:李影 教授、博导)
2018.09-2022.07 北京大学 计算机学院,计算机软件与理论,理学博士 (导师:吴中海/李影 教授、博导)
工作(实习)背景
2016-2018 微软亚洲研究院 MSRA,研究实习生
2022.09-至今 9968新浦京官网 9968新浦京官网,讲师
主要研究方向
本人主要以自然语言处理为主要研究方向,欢迎有志于科研且希望从事自然语言处理研究(对话生成、文本生成、比赛解说、预训练语言模型等)的本科生、硕士研究生:
1、开放域对话生成技术:开放域对话生成建模技术、未登陆词问题优化、知识融合的对话生成技术等。
2、文本生成技术:数据到文本技术(Data-to-Text)、游戏/赛事解说生成、文本隐写生成等。
3、预训练语言模型应用:预训练语言模型的训练、优化与应用。
学术成果
作为主要完成人的研究成果:
S18.【CCF-B类数据挖掘会议,长文,一作】 Sixing Wu, Ping Xue, Ye Tao, Ying Li, and Zhonghai Wu: Select, Extend, and Generate: Generative Knowledge Selection for Open-Domain Dialogue Response Generation,DASFAA 2023.
S17.【CCF-B类数据挖掘会议,短文,通讯(一作为所指导硕士)】 Fanxiao Li, Sixing Wu*, Jiong Yu, Shuoxin Wang, Bingbing Song, Renyang Liu, Haoseng Lai, and Wei Zhou: Rewriting-Stego: Generating Natural and Controllable Steganographic Text with Pre-trained Language Model, DASFAA 2023.
S16.【CCF-B类期刊,SCI一区(发表时),SCI二区(现在),长文,一作】Sixing Wu, Ying Li, Dawei Zhang, Zhonghai Wu: Generating Rational Commonsense Knowledge-Aware Dialogue Responses with Channel-Aware Knowledge Fusing Network IEEE/ACM Transactions on Audio, Speech and Language Processing, 2022.
S15.【CCF-B类自然语言会议,长文,一作】Sixing Wu, Ying Li, Ping Xue, Dawei Zhang and Zhonghai Wu: Section-Aware Commonsense Knowledge-Grounded Dialogue Generation with Pre-trained Language Model, COLING 2022.
S14.【CCF-B类顶级自然语言会议,长文 Findings,主要参与人】 Dawei Zhang, Sixing Wu, Yao Guo and Xiangqun Chen: MOBA-E2C: Generating MOBA Game Commentaries via Capturing Highlight Events from the Meta-Data, EMNLP 2022.
S13.【CCF-A类顶级自然语言会议,长文 Findings,一作】 Sixing Wu, Ying Li, Dawei Zhang, Zhonghai Wu: KSAM: Infusing Multi-Source Knowledge into Dialogue Generation via Knowledge Source Aware Multi-Head Decoding, ACL 2022.
S12.【CCF-B类顶级数据挖掘会议,长文,一作】Sixing Wu, Minghui Wang, Ying Li, Dawei Zhang, Zhonghai Wu: Improving the Applicability of Knowledge-Enhanced Dialogue Generation Systems by Using Heterogeneous Knowledge from Multiple Sources, WSDM 2022.
S11.【CCF-B类顶级自然语言会议,长文,一作】 Sixing Wu, Ying Li, Minghui Wang, Dawei Zhang, Yang Zhou, Zhonghai Wu: More is Better: Enhancing Open-Domain Dialogue Generation via Multi-Source Heterogeneous Knowledge, EMNLP 2021.
S10.【CCF-A类顶级语音交互会议,长文,一作】Sixing Wu , Dawei Zhang, Ying Li, Zhonghai Wu: Multi-Path Training Framework for Data-Driven Open-Domain Conversation System,ICASSP 2021.
S9.【CCF-A类顶级人工智能会议,长文,一作】Sixing Wu , Minghui Wang, Dawei Zhang, Yang Zhou, Ying Li, Zhonghai Wu: Knowledge-Aware Dialogue Generation via Hierarchical Infobox Accessing and Infobox-Dialogue Interaction Graph Network, IJCAI 2021.
S8.【CCF-B类顶级自然语言会议,长文 Findings,一作】 Sixing Wu,Ying Li, Dawei Zhang, Zhonghai Wu:
Improving Knowledge-Aware Dialogue Response Generation by Using Human-Written Prototype Dialogues, EMNLP 2020.
S7.【CCF-A类顶级人工智能会议,长文,一作】 Sixing Wu, Ying Li, Dawei Zhang, Yang Zhou, Zhonghai Wu: TopicKA: Generating Commonsense Knowledge-Aware Dialogue Responses Towards the Recommended Topic Fact. IJCAI 2020.
S6.【CCF-A类顶级自然语言会议,长文,一作】 Sixing Wu, Ying Li, Dawei Zhang, Yang Zhou, Zhonghai Wu: Diverse and Informative Dialogue Generation with Context-Specific Commonsense Knowledge Awareness, IJCAI 2020.
S5.【CCF-B类自然语言会议,长文,一作】 Sixing Wu, Dawei Zhang, Ying Li, Xing Xie, Zhonghai Wu: HL-EncDec: A Hybrid-Level Encoder-Decoder for Neural Response Generation, COLING 2018.
S4.【CCF-C类会议,短文,一作】 Sixing Wu, Ying Li, Xinyuan Zhang, Zhonghai Wu: DLCEncDec : A Fully Character-Level Encoder-Decoder Model for Neural Responding Conversation. COMPSAC 2018.
S3.【CCF-C类会议,长文,一作】 Sixing Wu, Ying Li, Zhonghai Wu: Low Frequency Words Compression in Neural Conversation System. ICONIP 2017.
S2.【发明专利,已授权,实际完成人、一作导师】李影, 巫思杏, 岳阳, 吴中海: 基于可疑行为识别的通讯诈骗实时检测方法和系统. 发明专利 已授权 2017
S1.【EI期刊,完成核心算法和所有实验】Nan Pan, Yi Liu, Sixing Wu: Adaptive Matching Algorithm for Laser Detection Signals of Linear Cutting Tool Marks. IET Signal Process, 2017
作为合作者参与的成果:
C6.【CCF-B类顶级自然语言会议,长文】 Zeru Zhang, Zijie Zhang, Yang Zhou, Lingfei Wu, Sixing Wu, Xiaoying Han, Dejing Dou, Tianshi Che and Da Yan: Adversarial Attack against Cross-lingual Knowledge Graph Alignment, EMNLP 2021.
C5.【CCF-A类顶级数据挖掘会议,长文】 Yang Zhou, Zeru Zhang, Sixing Wu, Victor Sheng, Xiaoying Han, Zijie Zhang and Ruoming Jin:Robust Network Alignment via Attack Signal Scaling and Adversarial Perturbation Elimination, WWW 2021.
C4.【已公开】Gong Zhang, Yang Zhou,Sixing Wu, Zeru Zhang, Dejing Dou: Cross-lingual Entity Alignment with Adversarial Kernel Embedding and Adversarial Knowledge Translation. CoRR abs/2104.07837, 2021
C3.【CCF-A类顶级机器学习会议,长文】 Jiaxiang Ren, Zijie Zhang, Jiayin Jin, Xin Zhao, Sixing Wu, Yelong Shen, Tianshi Che, Ruoming Jin, Dejing Dou: Integrated Defense for Resilient Graph Matching, ICML 2021.
C2.【CCF-C类会议,长文】 Yang Zhou, Jiaxiang Ren, Sixing Wu, Dejing Dou, Ruoming Jin, Zijie Zhang, Pengwei Wang: Semi-supervised Classification-based Local Vertex Ranking via Dual Generative Adversarial Nets. Big Data 2019.
C1.【CCF-B类顶级数据挖掘会议,短文】 Yang Zhou, Sixing Wu, Chao Jiang, Zijie Zhang, Dejing Dou, Ruoming Jin, Pengwei Wang:, Density-Adaptive Local Edge Representation Learning with Generative Adversarial Network Multi-label Edge Classification,ICDM 2018.
学术活动
截止2023年2月底,担任EMNLP 2022、ACL/ARR2021-2023、AAAI 2021-2023、NLPCC 2021-2022的等国内外顶级会议的审稿人(PC Member or Reviewer),以及IJCAI 2022紧急审稿人。
科研项目
P5. 预训练语言模型视角下的开放域对话与常识知识的高效匹配融合,9968新浦京官网,云南省教育厅2023年度科学研究基金项目,主持,进行中,2023-2024.
P4. 知识融合的开放域对话生成,9968新浦京官网,9968新浦京官网人才引进-青年培优计划项目,主持,进行中,2022-2025.
P3. 已隐藏
P2. 北京大学-工银科技智能推荐系统1期研究项目,校企合作项目,主要参与人,已结项,2020-2021.
P1. 基于非结构化数据的智慧城市知识建模与模型自增长自演化技术,国家重点研发计划项目下子课题, 北京大学,主要参与人,已结项,2017-2020.
课程信息
本科生课程《Python程序设计实践》:2022-2023学年春季学期
研究生课程《论文写作指导》:2022-2023学年春季学期
学生指导信息
2022-2025 硕士生:俞煚、赖浩森、王烁欣
2021-2024 硕士生:李钒效(合作指导)
2021-2025 本科生:软件工程专业 4人,人工智能专业 2人
2019-2023 毕设指导本科生:软件工程专业 5人,软件工程专业留学生 2人