Context Enhanced Short Text Matching using Clickthrough Data
论文链接TL;DR: 使用搜索引擎扩充 短文本相关结果,构造正负样本,补充短文本缺失的信息,最终与BERT baseline进行融合获得最终结果,主要是使用了外部信息来进行数据补充与增强。 Abstract目前的短文本匹配模型通常依赖于匹配的一对短文本,然而短文本通常缺少关键的线索;因此,短文本需要 ...
Read more
Pretraining without Wordpieces Learning Over a Vocabulary of Millions of Word 笔记
论文链接TL;DR:使用训练词的方式替代了原始BERT训练字的方式,在中英文下表现不错,尤其是NER、MRC等任务,且推理速度和BERT差不多(虽然增加了word embedding参数) Abstract标准的BERT分词使用子词分词法,可能将一个单词分为多个子词,如:lossless–>l ...
Read more
shell学习笔记-02-变量
1.ping test1变量定义与使用#!/usr/bin/baship=10.18.42.1if ping -c1 $ip &> /dev/null;thenecho "$ip is up."else echo "$ip is down."fi ...
Read more
C++基础--程序内存模型
1.内存分区模型C++程序在执行时,将内存大方向划分为4个区域 代码区:存放函数体的二进制代码,由操作系统进行管理 全局区:存放全局变量和静态变量以及常量 栈区:由编译器自动分配释放,存放函数的参数值、局部变量等 堆区:有程序员分配和释放,若程序员不释放,程序结束时候由操作系统回收 不同区存放数 ...
Read more
Que2Search Fast and Accurate Query Document Understanding for Search at Facebook笔记
ABSTRACT本文提出了Que2Search,用于搜索场景下query和product理解系统。Que2Search使用多模态和多任务去训练query和product的表示。通过将最新的多语言自然语言理解体系结构(如XLM和XLM-R)与多模态技术相结合,我们实现了超过5%的绝对离线相关性改进和超 ...
Read more
shell学习笔记-01
bash中调用python1.正常情况下bash解释器只能执行.sh脚本,加入<<-EOF EOF之后,可以执行python脚本(EOF只是人为定义的开始结束标记,可以换为其他字符) #!/usr/bin/bashping -c1 www.baidu.com && ech ...
Read more
智能搜索和推荐系统第十二章--推荐应用实战:基于广告平台的推荐
广告是为了达到某种特定的目的,向公众传递信息的宣传手段。广告对每一个企业业务的增长起到了举足轻重的作用。本章将介绍基于广告平台的推荐实践经验。 1 推荐系统的架构设计广告是互联网公司流量商业变现的主要形式,是由多方参与主体共同完成的一项商业营销活动。计算广告的核心问题是在给定的一系列上下文环境中,去 ...
Read more
智能搜索和推荐系统第十一章--搜索应用实战
1 电商搜索系统的架构设计在电商领域,一个完整的搜索系统的设计需要多年的经验和对整个领域的认知。下面先给出一个搜索系统架构示例,如下图所示。 对于电商公司来说,网站索引商品的量大概在百万级别,因此要求搜索引擎既要搜得准,又要搜得全。搜得准能够提升客户满意度,减少客户流失;搜得全能够给商品带来更多的曝 ...
Read more
智能搜索和推荐系统第十章--搜索引擎工具
本章主要介绍几款主流的搜索引擎工具:Lucene、Solr、Elasticsearch,因为在搜索、推荐和广告等场景中会越来越多地使用这些搜索引擎工具。 1.Lucene简介Lucene是一种高性能、可伸缩的信息搜索引擎,最初由鼎鼎大名的Doug Cutting开发,是基于Java实现的开源项目。L ...
Read more
智能搜索和推荐系统第九章--推荐系统的评价
1.推荐评估的目的推荐系统评估与推荐系统的产品定位息息相关。推荐系统是信息高效分发的手段,用于更快、更好地满足用户的不确定需求。所以,推荐系统的精准度、惊喜度、多样性等都是评估的指标。同时,推荐系统要具备稳定性。稳定性可以通过实验评估。在实现方面,是否能支撑大规模用户访问等也是推荐系统评估指标。 推 ...
Read more