Kylin大数据分析神兽

编程入门行业动态更新时间:2024-10-27 14:18:22

Kylin<a href=https://www.elefans.com/category/jswz/34/1759246.html style= 大数据分析神兽"/>

Kylin大数据分析神兽

apache版本安装

安装 hbase-1.2.11-bin.tar.gz

安装 hive-2.1.0

安装 hadoop-2.6.0-cdh

安装 zookeeper-3.4.12

安装 apache-kylin-2.0.0-bin-hbase1x.tar.gz 注意：cdh环境请下载其他版本

配置下环境变量直接启动即可

mysql远程访问

GRANT ALL PRIVILEGES ON hive.* TO 'root'@'%' IDENTIFIED BY '访问密码';
flush privileges;

hadoop编译snappy

.0.6.0/bk_installing_manually_book/content/rpm-chap1-11.html配置yarn文档

=================================================================================

企业版 kyligence 安装

官网：/

1、安装条件CDH，或者hadoop2.6+hbase1.2+hive2.1或者不用hbase

用mysql

1.在MySQL数据库中新建名为kylin的数据库
2.在Kyligence	Enterprise安装目录下的$KYLIN_HOME/conf/kylin.properties
配置文件中，配置kylin.metadata.url={metadata_name}@jdbc，
{metadata_name}需要替换为您需要的元数据表名，如	kylin_default_instance@jdbc	。
如果该表已存在，则会使用现有的表；如果不存在，则会自动创建该表。
具体示例如下：
kylin.metadata.url=kylin_default_instance@jdbc,url=jdbc:mysql://localhost:3306/kylin,
username=root,password=,maxActi ve=20,maxIdle=20。
如需使用MySQLCluster支持负载均衡时，需要在连接字符串中加入该参数，具体示例如下：
kylin.metadata.url=kylin_default_instance@jdbc,url=jdbc:mysql:loadbalance://host1:port1,
host2:port2/kylin,username=root,password=root,maxActive=20,maxIdle=20	
maxActive：最大数据库连接数，默认值为5	； maxIdle：最大等待中的连接数量，默认值为	5； 
maxWait：最大等待连接毫秒数，默认值为	1000	； 
3.由于元数据不依赖于HBase，所以需要在配置文件	$KYLIN_HOME/conf/kylin.properties中
添加zookeeper的连接项kylin.env.zookeeper-connect-string=host:port	，如kylin.env.zookeeper-connect-string=localhost:2181。
4.如果您需要对JDBC的密码进行加密，请在$KYLIN_HOME/tomcat/webapps/kylin/WEB-INF/lib目录下运行如下命令：
java	-classpath	kap.jar:spring-beans-4.3.10.RELEASE.jar:spring-core-4.3.10.RELEASE.jar:commons-codec-1.7.jar	org.apache.kylin.rest.security.PasswordPlaceholderConfigurer	AES	<your_password>

2、因为独立部署，需要用到hive2的客户端beeline

修改配置文件/opt/kylin/conf/kylin.properties

可以看到关闭了snappy压缩

kylin.source.hive.client=beeline 
kylin.source.hive.beeline-params=-n	root	-u	'jdbc:hive2://host:port'	--hiveconf	hive.execpress.output=false	--hive conf	dfs.replication=2		--hiveconf	hive.security.authorization.sqlstd.confwhitelist.append='mapreduce.job.*|dfs.*'

因为我们环境的hadoop没有snappy压缩，所以需要修改

kylin_hive_conf.xml 、kylin_job_conf.xml 、 kylin_job_conf_inmem.xml 这几个文件中的compress，改为false