欢迎关注同名微信公众号:徐阿衡(xu_a_heng)
GDAN,Question Generation 和 Question Answering 相结合,利用少量的有标注的 QA 对 + 大量的无标注的 QA 对来训练 QA 模型。Introduction看到这篇论文,看到来自 CMU,…查看全文
论文: Bidirectional Attention Flow for Machine Comprehension 代码: allenai/bi-att-flowAttention Summary这篇论文主要对 attention 机制做了改进,为此作者总结了 M…查看全文
论文:A simple neural network module for relational reasoning(2017)github代码: https://github.com/siddk/relation-network关系推理的传统方法有基于符号的方法(symb…查看全文
CMU & Google 出品的 Fast and Accurate Reading Comprehension by Combining Self-Attention and Convolution,SQuAD 目前的并列第一,榜单上对应模型 QANet。两大特…查看全文
Neural Turing Machine(NTC) 和 Differentiable Neural Machine(DNC) 的相关笔记。涉及论文:Neural Turing MachineNeural Turing Machine(2014)Differentiable Neural Mac…查看全文
开始涉猎多轮对话,这一篇想写一写对话管理(Dialog Management),感觉是个很庞大的工程,涉及的知识又多又杂,在这里只好挑重点做一个引导性的介绍,后续会逐个以单篇形…查看全文
比较传统的 NMT 把文档当做一系列独立的句子来进行翻译,忽略了句子之间的关系,或者说是忽略了篇章信息,这样会带来两个问题:一致性问题(inconsistency)如时态一致性问…查看全文
Memory Networks 相关笔记。这一篇会覆盖下面三个版本的 Memory NetworksMemory Network with strong supervisionEnd-to-End Memory NetworkDynamic Memory Network涉及下…查看全文
介绍一下经典的 HRED 和 VHRED。主要涉及到下面几篇论文Building end-to-end dialogue systems using generative hierarchical neural network modelsA Hierarchical Laten…查看全文
普通的 Seq2Seq 的 output dictionary 大小是固定的,对输出中包含有输入单词(尤其是 OOV 和 rare word) 的情况很不友好。一方面,训练中不常见的单词的 word embedding 质…查看全文