拥有0000-未整理-等待研究标签的文章

中文分词技术(中文分词原理) – 从程序到产品再到程序

一、 为什么要进行中文分词? 词是最小的能够独立活动的有意义的语言成分,英文单词之间是以空格作为自然分界符的,而汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。 Lucene中对中文的处理是基于自动切分的单字切分,或者二元切分。除此之外,还有最大切分(包括向前、向后、以及前后相结合)、最少切分、全切分等等。 二、 中文分词技术的分类...
阅读全文

centos mysql 查看版本 – 从程序到产品再到程序

\ mysql –help | grep Distribmysql  Ver 14.14 Distrib 5.7.20, for linuxglibc2.12 (x86_64) using  EditLine wrapperOriginal url: Created at: 20181127 10:59:53Category: defaultTags: none
阅读全文

领域专用语言(DSL)简介 – 从程序到产品再到程序

主要回答几下几个问题 1 什么是 DSL 2 为什么使用 DSL 3 何时使用 DSL什么是 DSLDSL(Domain Specified Language)领域专用语言。 要理解什么是领域专用语言,需要先了解其创建背景。即为什么会诞生这样一种事物,其发明的目的是为了解决什么问题。总的来说 DSL 是为了解决系统(包括硬件系统和软件系统)构建初期,使用者和构建者的语言...
阅读全文

Field datatypes | Elasticsearch Reference [6.x] | Elastic

You are looking at preliminary documentation for a future release. Not what you want? See the . » Field datatypesElasticsearch supports a number of different datatypes for the fields in a doc...
阅读全文

ElasticSearch创建索引(index)和添加映射(mapping) - qbian的博客 - CSDN博客

es的数据保存会根据你对每一个字段添加的映射去做过滤处理,处理完成后再做索引保存,所以在集群搭建完成后就想要创建索引,然后对需要处理的字段添加相应的映射。一、创建索引 index```curl XPUT 'http://localhost:9200/index' d '{ "settings": { "analysis": { "analyzer": { ...
阅读全文

elasticsearch+kafka日志收集和分析以及分布式配置(附) - yxz1025的专栏 - CSDN博客

```javascript<span style="fontfamily: Arial, Helvetica, sansserif; backgroundcolor: rgb(255, 255, 255);"由于公司内部业务需求,需要将大量的请求日志做统计分析,所以用到了elasticsearch全文搜索引擎</span```一、采用何种方式做日志收集1、采用mysql数据同步的方式将...
阅读全文

引发Elasticsearch OOM之type - 推酷

开源日志处理哪家强?当数 ,但搭起来容易用起来难,尤其是ES,小脾气那叫一个多,不好好调教下时不时的就会给你来点颜色,什么脑裂,内存不足 `OOM` ,要不就是索引过慢,性能跟不上;应有尽有,自从用起来,一把心酸.最近又出问题了,之前好好的集群(已经正常运行3个多月了),当新接入了一个服务(大部分只有写),变得频繁罢工,一周就要重启4次左右,搞得身心疲惫,终于发现故障的原因,故记之,警示后人...
阅读全文

同步 MySQL 数据到 Elasticsearch - 简书

在加入 PingCAP 之前,很长一段时间,我都跟 MySQL 打交道。MySQL 性能强悍,但是在一些全文检索,复杂查询上面并不快,效率堪忧。为了解决快速查的问题,我们之前尝试考虑过 Sphinx,但总觉得使用起来不方便。恰好那时候碰到了 Elasticsearch(ES),立刻就觉得这特么就是我们要的东西。ES 底层基于 Lucene ,支持分布式,同时还提供了强大的 web 页面,点点鼠...
阅读全文

Let's Encrypt,免费好用的 HTTPS 证书 | JerryQu 的小站

文章目录 提醒:本文最后更新于 974 天前,文中所描述的信息可能已发生改变,请谨慎使用。很早之前我就在关注 这个免费、自动化、开放的证书签发服务。它由 ISRG(Internet Security Research Group,互联网安全研究小组)提供服务,而 ISRG 是来自于美国加利福尼亚州的一个公益组织。Let's Encrypt ...
阅读全文

使用 Elasticsearch 实现博客站内搜索 | JerryQu 的小站

文章目录 提醒:本文最后更新于 971 天前,文中所描述的信息可能已发生改变,请谨慎使用。一直以来,为了优化本博客站内搜索效果和速度,我使用 bing 的 `site:` 站内搜索做为数据源,在服务端获取、解析、处理并缓存搜索结果,直接输出 HTML。这个方案唯一的问题是时效性难以保证,尽管我可以在发布和修改文章时主动告诉 bing,但它什么时候更新...
阅读全文