在刚刚结束的2017第四届世界互联网大会上,评选出了年度18项代表性的领先科技成果,阿里云ET大脑就是其中之一。众所周知,融合了先进的大数据、人工智能技术的阿里云ET大脑已经在智慧城市、智慧交通等众多领域得到了应用和推广。但你知不知道,阿里巴巴还有一个智慧的“大脑”,是你每天都离不开的。它就是智能消费导购与商品管控背后的“商品大脑”—— 阿里巴巴商品知识图谱。
就让我们一同走近阿里巴巴商品知识图谱,看看它神秘的面纱背后,到底有哪些闪亮的“黑科技”。
人工智能应用的“基础设施”一
阿里巴巴商品知识图谱已经广泛应用于搜索、前端导购、平台治理、智能问答、品牌商运营等核心和创新业务,但是对于普通消费者来说,感触最深的还是它让网上购物的体验更佳。举例来说,网上导购就是让消费者更容易找到他们想要的东西。当买家在搜索栏中输入“我要一条漂亮的真丝丝巾”,阿里巴巴商品知识图谱就会通过语法词法分析提取出语义的要点,如 “一”、“漂亮”、“真丝”、“丝巾”等关键词,并据此帮买家实时搜索到适合的商品。随着大数据、人工智能等技术的快速进步,阿里巴巴商品知识图谱也变得越来越聪明,可以通过实时学习构建出场景,当你输入“去东北滑雪要买什么”时,搜索结果中会出现与滑雪相关的各类商品信息。
淘宝网搜索示例
什么是知识图谱?它是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互关系。简而言之,知识图谱就是机器大脑中的知识库,也是人工智能应用的基础设施。
在创造了“双11”一个又一个销售奇迹之后,可想而知,阿里巴巴的商品库有多么庞大,来自于淘宝、天猫、1688、AliExpress等多个市场的数据,品牌商、行业运营、治理运营、消费者、国家机构、物流商等多种角色参与其中。让电商大数据更好地服务消费者是阿里巴巴首先要解决的问题。
阿里巴巴选择以知识图谱的理念重构电商核心数据,通过知识表示技术实现商品数据的标准化, 通过命名实体识别和实体链指技术与内外部数据之间的深度互联,通过逻辑推理校验图谱数据质量,进一步补全图谱关系。
阿里巴巴商品知识图谱的强大具体表现在哪些方面?它承载着商品标准化这一基础性、根源性的工作,通过知识表示来规范对商品数据的描述。正因为如此,我们才能知道哪些商品是同样一件东西,产品卖到了哪些市场,单品的销量可以被精确统计……
阿里巴巴商品知识图谱以商品、 标准产品、 标准品牌、 标准条码、标准分类为核心,利用实体识别、实体链指和语义分析技术,整合关联了诸如舆情、百科、国家行业标准等9大类一级本体,包含百亿级别的三元组,形成了巨大的知识网。基于这个巨大的知识网络,消费者的购物体验得到持续改善,消费者判断的成本也逐步降低。
概括说,阿里巴巴商品知识图谱综合利用前沿的NLP、语义推理和深度学习等技术,打造了全网商品智能服务体系,服务阿里巴巴生态中的各个角色。
也正因为如此,在11月7日举行的2017中国大数据技术大会(BDTC)上,阿里商品知识图谱荣获“TOP10大数据应用最佳实践奖”,赢得了市场和用户的充分肯定。
阿里巴巴业务平台商品知识图谱负责人张伟(左七)代表团队接受颁奖
知识图谱背后的“黑科技”二
你可能每天都会到淘宝或天猫上逛逛,但可能从未留意过“后台”到底是什么能让你的购物体验变得更加顺畅、轻松。阿里巴巴知识图谱每天的拦截量达到千万级别,全量智能审核次数达到亿级别,最大限度地保护了知识产权,以及消费者权益。
阿里巴巴商品知识图谱的一个核心功能是“平台治理”,它是保证阿里巴巴商业生态安全、可靠运行的基本保障。举例来说,阿里巴巴商品知识图谱被用于阿里电商平台的管控。过去,电商通常只能通过人工巡检对商品发布进行审核,而现在面对海量的商品发布量,人工巡检模式捉襟见肘。形象地说,阿里巴巴商品知识图谱就像拉起了一张过滤网,通过大数据分析、人工智能等技术,筛查出不良信息,阻止其进入阿里巴巴生态。
阿里巴巴商品知识图谱能够实现如此高效的智能识别,其背后是否也有“黑科技”助阵?答案是肯定的。这里主要介绍一下阿里巴巴商品知识图谱是如何实现推理的。
阿里巴巴的业务知识/规则、管控知识/规则、国家行业规则错综复杂。针对这种情况,阿里巴巴设计了一套框架做知识表示和推理,并按照不同场景,将推理分为上下位和等价推理、不一致性推理、知识发现推理、本体概念推理等。
所谓上下位和等价推理,就是在检索父类时,通过上下位推理把子类的对象召回,同时利用等价推理(实体的同义词、变异词、同款模型等),扩大召回。一个例子,比如需要拦截“产地为某核污染区域的食品”,推理引擎翻译为“找到产地为该区域且属性项与产地同义、属性值是该区域下位实体的食品,以及与命中的食品是同款的食品”。
另外,不一致推理是指在与问题卖家对弈的过程中,需要对商品标题、属性、图片、商品资质、卖家资质中的品牌、材质、成分等基础信息做一致性校验。比如,标题中的品牌是Nike,而属性或者吊牌中显示的品牌是Nake,这些标称不一致的商品即被推理引擎判断为有问题的商品。
在推理引擎的背后,其实是把自然语言通过语义解析(Semantic Parsing)转换为逻辑表达式(Logical Form)。语义解析采用了结合神经网络和符号逻辑执行的方式。而逻辑表达式又会触发后续的逻辑推理和图推理。
推理引擎背后技术框架
伴随着阿里巴巴商品知识图谱的建设,阿里巴巴电商平台的管控已从过去的“巡检”模式升级为发布端实时逐一检查。阿里巴巴商品知识图谱的推理引擎技术满足了智能化、自学习、毫秒级响应、可解释等更高的技术要求。
三年,阿里巴巴知识图谱到底做了什么?三
提到知识图谱,很多人可能会首先想到谷歌、百度。他们确实起步比较早。不过,阿里巴巴仅用三年时间,就成功打造出国内最顶尖的电商域知识图谱。阿里巴巴是以应用促创新的典型代表。正是因为有了阿里巴巴庞大而复杂的商业生态,正是出于让用户拥有更好体验的不懈追求,才让阿里巴巴在知识图谱,甚至更广义的人工智能领域不断取得突破。未来,阿里巴巴还将继续深化与学界专家的合作,共同培育和打造开放的知识图谱社区。
阿里巴巴商品知识图谱在今年的杭州云栖大会上一亮相就博得了满堂彩。借此机会,阿里巴巴广邀全球技术领域的专家与学界大咖,共同研讨知识图谱领域的现状与远景,加深交流与互动。阿里巴巴早就与苏州大学国家杰出青年基金获得者张民教授及其团队建立了合作,研究知识图谱领域里涉及的文本处理前沿技术,此外还与浙江大学陈华钧教授的团队建立了合作,主攻知识图谱领域里知识表示与推理前沿技术方向。阿里巴巴商品知识图谱团队还与国际上的专业组织频繁交流与合作,全面开展数据合作。
让人感到兴奋的是,人工智能领域的顶级会议之一——2018年国际人工智能协会年会(AAAI)将在美国新奥尔良举行,阿里巴巴有多篇论文入选,其中就包括阿里巴巴业务平台事业部与苏州大学知识图谱联合项目的两篇论文。论文主要关注知识图谱构建过程中文本挖掘核心技术的创新。
仅用三年时间,阿里巴巴就积累并形成了一个巨大的知识图谱和海量的标准数据,通过与高校的联合研发,引入前沿的自然语言处理、知识表示和逻辑推理技术等,形成了完整的知识图谱技术平台,打造了全网商品智能服务体系,稳定支撑线上的全球消费者和卖家。知识图谱已经成了阿里“新零售”和国际化发展的智能引擎。
Original url: Access
Created at: 2019-05-09 10:37:12
Category: default
Tags: none
未标明原创文章均为采集,版权归作者所有,转载无需和我联系,请注明原出处,南摩阿彌陀佛,知识,不只知道,要得到
java windows火焰图_mob64ca12ec8020的技术博客_51CTO博客 - 在windows下不可行,不知道作者是怎样搞的 监听SpringBoot 服务启动成功事件并打印信息_监听springboot启动完毕-CSDN博客 SpringBoot中就绪探针和存活探针_management.endpoint.health.probes.enabled-CSDN博客 u2u转换板 - 嘉立创EDA开源硬件平台 Spring Boot 项目的轻量级 HTTP 客户端 retrofit 框架,快来试试它!_Java精选-CSDN博客 手把手教你打造一套最牛的知识笔记管理系统! - 知乎 - 想法有重合-理论可参考 安宇雨 闲鱼 机械键盘 客制化 开贴记录 文本 linux 使用find命令查找包含某字符串的文件_beijihukk的博客-CSDN博客_find 查找字符串 ---- mac 也适用 安宇雨 打字音 记录集合 B站 bilibili 自行搭建 开坑 真正的客制化 安宇雨 黑苹果开坑 查找工具包maven pom 引用地 工具网站 Dantelis 介绍的玩轴入坑攻略 --- 关于轴的一些说法 --- 非官方 ---- 心得而已 --- 长期开坑更新 [本人问题][新开坑位]关于自动化测试的工具与平台应用 机械键盘 开团 网站记录 -- 能做一个收集的程序就好了 不过现在没时间 -- 信息大多是在群里发的 - 你要让垃圾佬 都去一个地方看难度也是很大的 精神支柱 [超级前台]sprinbboot maven superdesk-app 记录 [信息有用] [环境准备] [基本完成] [sebp/elk] 给已创建的Docker容器增加新的端口映射 - qq_30599553的博客 - CSDN博客 [正在研究] Elasticsearch, Logstash, Kibana (ELK) Docker image documentation elasticsearch centos 安装记录 及 启动手记 正式服务器 39 elasticsearch 问题合集 不断更新 6.1.1 | 6.5.1 两个版本 博客程序 - 测试 - bug记录 等等问题 laravel的启动过程解析 - lpfuture - 博客园 OAuth2 Server PHP 用 Laravel 搭建带 OAuth2 验证的 RESTful 服务 | Laravel China 社区 - 高品质的 Laravel 和 PHP 开发者社区 利用Laravel 搭建oauth2 API接口 附 Unauthenticated 解决办法 - 煮茶的博客 - SegmentFault 思否 使用 OAuth2-Server-php 搭建 OAuth2 Server - 午时的海 - 博客园 基于PHP构建OAuth 2.0 服务端 认证平台 - Endv - 博客园 Laravel 的 Artisan 命令行工具 Laravel 的文件系统和云存储功能集成 浅谈Chromium中的设计模式--终--Observer模式 浅谈Chromium中的设计模式--二--pre/post和Delegate模式 浅谈Chromium中的设计模式--一--Chromium中模块分层和进程模型 DeepMind 4 Hacking Yourself README.md update 20211011
Laravel China 简书 知乎 博客园 CSDN博客 开源中国 Go Further Ryan是菜鸟 | LNMP技术栈笔记 云栖社区-阿里云 Netflix技术博客 Techie Delight Linkedin技术博客 Dropbox技术博客 Facebook技术博客 淘宝中间件团队 美团技术博客 360技术博客 古巷博客 - 一个专注于分享的不正常博客 软件测试知识传播 - 测试窝 有赞技术团队 阮一峰 语雀 静觅丨崔庆才的个人博客 软件测试从业者综合能力提升 - isTester IBM Java 开发 使用开放 Java 生态系统开发现代应用程序 pengdai 一个强大的博主 HTML5资源教程 | 分享HTML5开发资源和开发教程 蘑菇博客 - 专注于技术分享的博客平台 个人博客-leapMie 流星007 CSDN博客 - 舍其小伙伴 稀土掘金 Go 技术论坛 | Golang / Go 语言中国知识社区
最新评论