第二种方法:安装扩展之结巴
结巴
是一个php拓展,使用过程中需要自己编译安装拓展,遇到的问题是在编译安装拓展的时候要使用 phpize
,这个是个什么东西...看看官方怎么说的:Installation of PECL extensions,原来phpize命令是用来为PHP扩展准备构建环境。明白是什么了,那么问题来了。。。官方没有说明是要怎么安装的,其实很简单,只要执行 apt install php7.0-dev
就搞定啦,不过要重新启动 php7.0-fpm
才可以生效咧。git clone https://github.com/jonnywang/phpjieba.git
cd phpjieba/cjieba
make
cd ..
phpize
./configure
make
make install
然后在php.ini中添加
```ruby
extension=jieba.so
jieba.enable=1
jieba.dict_path=/opt/phpjieba/cjieba/dict (这是我编译时的文件路径,你需要换成你自己的)
```
* 安装完之后的使用可以说是相当简单了,想要分词的时候只要结巴一下就好了:
```php
<?php
$result = jieba('结巴一下,就可以用了!', 0);
print_r($result);
// Array ( [0] => 用了 [1] => 结巴 [2] => 一下 )
$result = jieba('结巴一下,就可以用了!', 1);
print_r($result);
//Array ( [0] => 结巴 [1] => 一下 [2] => , [3] => 就 [4] => 可以 [5] => 用了 [6] => ! )
$result = jieba('结巴一下,就可以用了!', 2);
print_r($result);
// Array ( [结巴] => n [一下] => m [,] => x [就] => d [可以] => c [用了] => x [!] => x )
$result = jieba('结巴一下,就可以用了!');
print_r($result);
// Array ( [0] => 用了 [1] => 结巴 [2] => 一下 )
```
* `jieba` 的时候可以传入两个参数,第一个参数是 `string` 类型的,一个中文的字符串,第二个参数是选择结巴的类型,有三个参数可以选, `0、1、2`,其中 `0` 是提取关键字,`1` 是切字分词, `2` 是获取词性标注。
可以看出默认的时候是进行提取关键词的操作。
* 缺点
* 会降低php的性能,可以明显感觉到第一次配置好拓展之后开启 `PHP-FPM` 的速度会慢很多。不过不影响之后使用的性能。
* 因为加载的字典文件过大,从而占用过多,可能会造成php-fpm进程被迫中止,需要添加swap交换内存。附上添加swap内存的方法。这里添加的是1G的内存(count=1024)
```jsx
/bin/dd if=/dev/zero of=/var/swap.1 bs=1M count=1024
/sbin/mkswap /var/swap.1
/sbin/swapon /var/swap.1
```
Original url: Access
Created at: 2019-10-06 22:24:13
Category: default
Tags: none
未标明原创文章均为采集,版权归作者所有,转载无需和我联系,请注明原出处,南摩阿彌陀佛,知识,不只知道,要得到
java windows火焰图_mob64ca12ec8020的技术博客_51CTO博客 - 在windows下不可行,不知道作者是怎样搞的 监听SpringBoot 服务启动成功事件并打印信息_监听springboot启动完毕-CSDN博客 SpringBoot中就绪探针和存活探针_management.endpoint.health.probes.enabled-CSDN博客 u2u转换板 - 嘉立创EDA开源硬件平台 Spring Boot 项目的轻量级 HTTP 客户端 retrofit 框架,快来试试它!_Java精选-CSDN博客 手把手教你打造一套最牛的知识笔记管理系统! - 知乎 - 想法有重合-理论可参考 安宇雨 闲鱼 机械键盘 客制化 开贴记录 文本 linux 使用find命令查找包含某字符串的文件_beijihukk的博客-CSDN博客_find 查找字符串 ---- mac 也适用 安宇雨 打字音 记录集合 B站 bilibili 自行搭建 开坑 真正的客制化 安宇雨 黑苹果开坑 查找工具包maven pom 引用地 工具网站 Dantelis 介绍的玩轴入坑攻略 --- 关于轴的一些说法 --- 非官方 ---- 心得而已 --- 长期开坑更新 [本人问题][新开坑位]关于自动化测试的工具与平台应用 机械键盘 开团 网站记录 -- 能做一个收集的程序就好了 不过现在没时间 -- 信息大多是在群里发的 - 你要让垃圾佬 都去一个地方看难度也是很大的 精神支柱 [超级前台]sprinbboot maven superdesk-app 记录 [信息有用] [环境准备] [基本完成] [sebp/elk] 给已创建的Docker容器增加新的端口映射 - qq_30599553的博客 - CSDN博客 [正在研究] Elasticsearch, Logstash, Kibana (ELK) Docker image documentation elasticsearch centos 安装记录 及 启动手记 正式服务器 39 elasticsearch 问题合集 不断更新 6.1.1 | 6.5.1 两个版本 博客程序 - 测试 - bug记录 等等问题 laravel的启动过程解析 - lpfuture - 博客园 OAuth2 Server PHP 用 Laravel 搭建带 OAuth2 验证的 RESTful 服务 | Laravel China 社区 - 高品质的 Laravel 和 PHP 开发者社区 利用Laravel 搭建oauth2 API接口 附 Unauthenticated 解决办法 - 煮茶的博客 - SegmentFault 思否 使用 OAuth2-Server-php 搭建 OAuth2 Server - 午时的海 - 博客园 基于PHP构建OAuth 2.0 服务端 认证平台 - Endv - 博客园 Laravel 的 Artisan 命令行工具 Laravel 的文件系统和云存储功能集成 浅谈Chromium中的设计模式--终--Observer模式 浅谈Chromium中的设计模式--二--pre/post和Delegate模式 浅谈Chromium中的设计模式--一--Chromium中模块分层和进程模型 DeepMind 4 Hacking Yourself README.md update 20211011
Laravel China 简书 知乎 博客园 CSDN博客 开源中国 Go Further Ryan是菜鸟 | LNMP技术栈笔记 云栖社区-阿里云 Netflix技术博客 Techie Delight Linkedin技术博客 Dropbox技术博客 Facebook技术博客 淘宝中间件团队 美团技术博客 360技术博客 古巷博客 - 一个专注于分享的不正常博客 软件测试知识传播 - 测试窝 有赞技术团队 阮一峰 语雀 静觅丨崔庆才的个人博客 软件测试从业者综合能力提升 - isTester IBM Java 开发 使用开放 Java 生态系统开发现代应用程序 pengdai 一个强大的博主 HTML5资源教程 | 分享HTML5开发资源和开发教程 蘑菇博客 - 专注于技术分享的博客平台 个人博客-leapMie 流星007 CSDN博客 - 舍其小伙伴 稀土掘金 Go 技术论坛 | Golang / Go 语言中国知识社区
最新评论