datasophon1.2.1 二开
本文介绍了在麒麟V10系统上安装Datasophon 1.2.1时遇到的问题及优化方案。作者遇到麒麟系统权限限制和AKKA通讯不稳定的问题,特别是Agent分发时75%卡顿现象。通过分析源码发现问题出在AKKA通讯组件上,于是自主开发了兼容AKKA调用的简化版通讯框架Stable-Actor。优化后测试显示能稳定达到100%进度,但需要每次先删除集群并重启服务。作者表示这只是初步改进,后续可能还会
背景
前几个月,觉得安装大数据环境真是麻烦,所以想找找是否有一键安装的工具,别人给我推荐国产的Datasophon ,这个工具听说过,但是印象不是很好。去年我同事打算使用它配置大数据组件,结果碰到各种各样问题,最后不了了之。当时我也是有其他事情,没有时间研究。今天有时间研究为何这么难用。我就计划安装在麒麟V10 操作系统
问题
我先列一下目前安装遇到的问题,其他的问题,继续往下安装再看
麒麟V10权限问题
麒麟安全性挺高的,默认是不能执行脚本,所以设置软件模式:
sudo setstatus Softmode
命令适配问题
有些命令在麒麟系统无法执行,需要修改。至于修改了那些命令我就不列,有兴趣的可以参考git源码
AKKA不稳定问题

当Agent分发时,进度达到75%,有些环境稍微等会就过去了;但是有些环境就卡住,最后超时报错。我就纳闷它干嘛呢?后来,研究源码发现,master在等worker返回,worker所在机器信息:CPU,内存,硬盘等信息,然后变成100%。如果一直收不到应答,它就超时报错。它的通讯组件用什么呢?就是用akka。看来不咋地,稳定性不好。
优化
我在三台虚拟机上安装datasophon,网络可能没有云机器网络好,总是卡在75%。后来网上找看是否有替换组件,还找到一个叫Pekko,但是这个工具也庞大,复杂。我心想不就是弄一个网络通讯吗,有必要这么复杂吗!可能它支持协议比较多。所以有DIY想法,支持TCP/IP协议即可。后来亲手打造一个,兼容akka调用。但是简单多了
git 地址:https://gitee.com/longsebo/stable-actor-framework.git
当然datasophon 调用及配置也需要调整,git 地址:
https://gitee.com/longsebo/datasophon.git
效果
我连续测三遍,都能顺利到达100%。
不过操作步骤按如下:
每次都先删除上一个集群,然后重启datasophon-manager:
root@ddp1:/opt/datasophon-manager-1.2.1/bin# ./stop.sh
所有worker节点都停止worker:
service datasophon-worker stop
最后
当然这只是,万里长征第一步,后面估计还有好多坑及挑战。毕竟我把它通讯组件,釜底抽薪,彻底换掉。可能有些重构错漏地方。在所难免。如需沟通:lita2lz
更多推荐

所有评论(0)