编辑:[db:作者] 时间:2024-08-25 04:02:10
背景很大略,现实蛮繁芜!
我们面临以下几个难题:
①商家数据库和商品数据库是多台不同的做事器,并且数据量达百万级,如何才能实现跨数据库的数据同步呢?
②商家和商品的数据是有从属关系的,不然就会把肯德基的喷鼻香辣鸡腿堡挂到麦当劳去,这就尴尬了!
③商家商品数据是常常更新的,比如修正价格、库存、高下架等,那搜索做事可不能搜出一堆过期的数据,如果客户明明搜出来的商品,点进去后却已下架了,那么客户就要吐槽了!
如何实现搜索数据与源数据库增编削均实时同步呢?
带着以上3个问题,我们开始了搜索做事的整体架构设计。
系统架构设计思路为了设计出得当的系统架构,我们剖析了现状。
首先,商家数据和商品数据分别存储在2个独立的MySQL8数据库,为知足商家数据和商品数据的关联,我们须要将两个库中所须要的表实时ETL到我们的搜索系统数据库。
其次,数据从商家、商品数据库ETL到搜索系统数据库后,须要实时的组合成为商家关联商品数据构造,并以父子文档的格式,存储到ES中。
末了,商家、商品数据库的增编削操作,须要实时的同步到ES中,也便是ES中的数据,须要支持实时的增加、删除和修正。
为此,我们设计了2个canal组件,第一个canal实现数据ETL,把商家、商品数据库的某些表及字段,抽取到搜索做事数据库;再利用第二个canal,读取搜索做事MySQL数据库的binlog,实时传输到kafka行列步队,再由canal adapter对数据进行关联、父子文档映射等,将处理好的数据存储到ElasticSearch中。
具体系统架构设计如下图所示。
商家商品搜索系统架构设计
项目实战
1、环境及软件解释操作系统:CentOS 7
canal:canal.adapter-1.1.4,canal.deployer-1.1.4
kafka:kafka_2.12-2.3.0
ElasticSearch:elasticsearch-6.3.2
kibana:kibana-6.3.2
2、利用Canal实现数据ETL到MySQL8这个步骤是利用canal从2个独立的MySQL8数据库中,抽取须要的表到搜索做事的MySQL数据库。
2.1 安装canaldeployer(1)解压canal.deployer-1.1.4.tar.gz
(2)配置canal deployer
进入canaldeployer/conf目录,修正canal.properties文件,紧张配置serverMode、MQ和destination三部分。
首先,我们serverMode修正为kafka模式,增加系统缓冲能力以及提高系统稳定性:
serverMode
接着,配置kafka的MQ信息(kafka请自行安装):
kafka MQ信息
末了,配置须要实例化的instance,这里配置了3个,表示canal deploy会启动这3个实例,同步MySQL的binlog到kafka的topic内。如下图所示:
destinations实例配置
(3)配置canal deployer instance
进入canaldeployer/conf/example目录,创造有一个instance.properties文件,这是canal给的示例,我们可以参考其配置。
①我们拷贝全体example目录,并重命名为上个步骤配置的destination之一,如xxxsearch;
②进入xxxsearch目录,编辑instance.properties文件,紧张配置源数据库信息、所需数据表及字段,以及指定kafka的topic名,这样源数据库的binlog就会转换为json数据,并实时的通过canal deployer传输到kafka该topic中。如下所示:
canaldeploy instance 源数据库配置
canaldeploy instance kafka topic配置
③进入canaldeployer/bin目录,实行./startup.sh,启动canal deployer及所属实例。
至此canal deployer搭建完成。
2.2 安装canal.adapter我们须要利用canal.adapter将kafka topic中的binlog json数据,经由洗濯转换等操作,存储到MySQL8中。由于canal原生是不支持MySQL8的,故我们须要做一些调度。
(1)增加MySQL8连接驱动
解压canal.adapter-1.1.4.tar.gz,进入canaladapter/lib目录,移除mysql-connector-java-5.1.40.jar,导入mysql-connector-java-8.0.18.jar
(2)配置canal adapter,使数据输出到MySQL8。
进入canaladapter/conf目录,编辑application.yml文件,紧张配置消费kafka、源数据库信息和搜索系统数据库信息,如下所示:
ETL到MySQL8配置
接着,进入canaladapter/conf/rdb目录,以官方供应的mytest_user.yml为例,配置kafka topic名、源数据库名、源数据表名,以及目标数据库名和目标数据表名,建议一张表对应一个yml文件。
ETL表构造映射配置
(3)启动canaladapter
进入canaladapter/bin目录,实行./startup.sh,启动canal adapter,不雅观察logs/adapter/adapter.log日志文件,手动在搜索系统数据库新增一条记录,看是否会打印如下日志,即有2条记录,一条INFO,一条DEBUG,则表示配置成功。
canaladapter日志
至此,数据ETL阶段搭建完成,数据可从两个不同的MySQL8数据库,实时同步到搜索做事的MySQL数据库。
3、实现数据多表关联、父子文档映射(1)配置第二个canal的canaladapter
进入canaladapter/conf目录,编辑application.yml文件,紧张配置消费kafka、搜索系统数据库,和ES连接信息,如下所示:
canaladapter MQ及mysql配置
canaladapter ES配置
(2)配置多表关联
进入canaladapter/conf/es目录,vim mytest_user.yml,编辑多表关联配置:
多表关联配置
把稳,sql支持多表关联自由组合, 但是有一定的限定:
(a)主表不能为子查询语句
(b)只能利用left outer join即最左表一定假如主表
(c)关联从表如果是子查询不能有多张表
(d)主sql中不能有where查询条件(从表子查询中可以有where条件但是不推举, 可能会造成数据同步的不一致, 比如修正了where条件中的字段内容)
(e)关联条件只许可主外键的'='操作不能涌现其他常量判断比如: on a.role_id=b.id and b.statues=1
(f)关联条件必须要有一个字段涌如今主查询语句中比如: on a.role_id=b.id 个中的 a.role_id 或者 b.id 必须涌如今主select语句中
(g)Elastic Search的mapping 属性与sql的查询值将逐一对应(不支持 select ), 比如: select a.id as _id, a.name, a.email as _email from user, 个中name将映射到es mapping的name field, _email将映射到mapping的_email field, 这里以别名(如果有别名)作为终极的映射字段. 这里的_id可以填写到配置文件的 _id: _id映射.
(3)配置父子文档
以官方的biz_order.yml为例,vim biz_order.yml,配置父子文档映射:
配置父子文档映射
(4)在ElasticSearch6中,建立index和父子文档映射关系
进入kibana页面,点击Dev Tools,实行如下命令,即可建立索引及父子文档映射:
建立index和父子文档映射
个中,ES6和kibana的安装,在此无特殊配置,不做赘述。
(5)启动canal adapter
进入canaladapter/bin目录,实行./startup.sh,启动canal adapter,不雅观察logs/adapter/adapter.log日志文件,手动在搜索系统数据库新增一条记录,看是否会打印如下日志,如打印则表示配置成功。
精确配置adapter日志示例
4、运行结果现在,我们可以通过kibana来实行DSL语句来查询看看。
我们事先已在商家系统中增加了一个“肯德基”商店,然后在商品系统中添加了“西红柿”和”新鲜西红柿“2个商品,并将商品关联到“肯德基”上。接着我们查询”肯德基“或者“西红柿”,得到以下是查询的结果(去除了ES默认字段):
通过DSL查询的结果
由图可见,我们可以通过商家名查询商品,也可通过商品名查询商店和商品,并且canal支持数据的实时增编削,以是ES的数据也会与商家系统和商品系统保持同等,同时数据构造包含商家及对应的商品,知足业务需求。
5、总结至此,基于Canal、kafka、MySQL8、ElasticSearch6技能的商家商品搜索系统根本框架搭建完成。我们采取canal deployer实时读取商家、商品系统的MySQL数据库binlog,并发送至kafka,接着由canal adapter消费kafka,并将binlog json数据进行多表关联、父子文档映射,末了存储到ES6中,供上层搜索做事调用。
搜索做事系统终极成功上线,为公司百万级商家商品供应实时数据同步,秒级搜索结果展示,达到业务哀求,老板说了,给研发团队每人加个鸡腿!
想想还有点小激动,嘿嘿~~
作者:微微科技技能团队
链接:https://juejin.im/post/5e6989faf265da5756326908
来源:掘金
本站所发布的文字与图片素材为非商业目的改编或整理,版权归原作者所有,如侵权或涉及违法,请联系我们删除,如需转载请保留原文地址:http://www.baanla.com/lz/zxbj/111320.html
下一篇:返回列表
Copyright 2005-20203 www.baidu.com 版权所有 | 琼ICP备2023011765号-4 | 统计代码
声明:本站所有内容均只可用于学习参考,信息与图片素材来源于互联网,如内容侵权与违规,请与本站联系,将在三个工作日内处理,联系邮箱:123456789@qq.com