介绍Kettle循环遍历表 ...

使用虚拟机监控和分析工具可以加快我们分析、定位问题的速度,下面介绍JDK提供的常用工具。 ...

Kettle是一个优秀的ETL工具,ETL即数据抽取(Extract)、转换(Transform)、装载(Load)的过程。它是构建数据仓库的重要环节。 ...

通过maven来构建scala与java混合程序 ...

spring官方的spring-boot-actuator提供了对单个spring-boot的监控,暴露了rest api。但是对于运维不太友好,毕竟图形化监控界面更加合理。spring-boot-admin则基于spring-boot-actuator提供了一个ui,更加易用。 ...

对于不使用 trident api 的人来说,使用基本的Storm spout, bolt操作,需要理解storm的ack机制,保证消息的完整性,Storm提供了三种不同层次的消息保证机制,分别是 At Most Once 、 At Least Once 以及 Exactly Once 。 trident可以理解为Storm批处理的高级抽象,提供了分组、分区、聚合、函数等操作,提供一致性和恰好一次处理的语义。 ...

介绍Sqoop2安装,以及对官网5分钟入门的实践。 ...

介绍Spark Streaming整合kafka,统计单词。 ...

在使用 RestTemplate 调用其他服务时,发现服务返回 401 状态码时,会抛出 HttpClientErrorException 异常。但是通过 getResponseBodyAsString() 却无法获取 Response Body 内容,下面是实际例子。 ...

基于nginx访问日志,分析用户的一些信息。 ...

大数据学习过程中,采用docker搭建环境,方便快速。 ...

kafka——分布式流数据平台 ...