-
[bigdata-028]apache nifi 从mysql导出数据到hbase
所属栏目:[大数据] 日期:2021-01-01 热度:50
0.在hbase节点,启动thrift服务 hbase-daemon.sh start thrift 1. 在本机启动nif ./bin/nifi.sh start 2. 在浏览器输入http://localhost:8080/nifi,看到nifi的界面 3. 拖一个processor ExecuteSQL到界面 ??? 3.1 在processor上点击右键,选择configure,[详细]
-
27、Power Query-日期与时间数据处理实例(图书室借书统计)
所属栏目:[大数据] 日期:2021-01-01 热度:131
本节要点:Power Query-日期与时间数据处理实例(图书室借书统计) 承接上一节的需求,我们引入切片器的功能,对图书室的借书以及归还情况进行查询和筛选,效果图如下: 对“借书状态”和“归还状态”进行筛选,亦可同时筛[详细]
-
读取csv数据并保存成图像
所属栏目:[大数据] 日期:2020-12-31 热度:135
int main(int argc,char* argv[]){ifstream file("******.csv");string value;int i = 0;int j = 0;while (file.good()){getline(file,value,'n');//cout string(value,value.length()) endl;if (i 0){value.erase(0,2);value.erase(value.length() - 9);[详细]
-
几种大数阶乘算法效率比较(Java)
所属栏目:[大数据] 日期:2020-12-31 热度:113
完整代码: package bigdatamul;import java.math.BigInteger;/** * 大数阶乘 * * @Description: TODO(大数阶乘) * * @author yzy * @date 2016-12-20 上午9:31:14 * */public class Test { public static void main(String[] args) { //单位:ms //fun1(5[详细]
-
[bigdata-005] 用docker搭建oracle 11g并提供python3 开发
所属栏目:[大数据] 日期:2020-12-31 热度:129
参考资料 http://www.bubuko.com/infodetail-401514.html 1. docker上的oracle 11g https://hub.docker.com/r/alexeiled/docker-oracle-xe-11g/ 安装和启动命令: 1.1 docker pull alexeiled/docker-oracle-xe-11g 1.2 docker run --name dck-oracle-11g -[详细]
-
[bigdata-006] 工作流 tez和oozie
所属栏目:[大数据] 日期:2020-12-31 热度:148
1.? 基本状况 Tez是Hortonworks开发的。 董西成的分析 http://dongxicheng.org/mapreduce-nextgen/apache-tez/ http://zh.hortonworks.com/blog/introducing-tez-faster-hadoop-processing/ tez运行在Yarn上的,DAG工作流,底层设计,对Map和Reduce进一步[详细]
-
HDoj1047Integer Inquiry(大数连续相加)
所属栏目:[大数据] 日期:2020-12-31 热度:71
Integer Inquiry Time Limit: 2000/1000 MS (Java/Others)????Memory Limit: 65536/32768 K (Java/Others) Total Submission(s): 19438????Accepted Submission(s): 5087 Problem Description One of the first users of BIT's new supercomputer was Chip[详细]
-
logminer挖掘
所属栏目:[大数据] 日期:2020-12-31 热度:133
1.???? Logminer介绍 LogMiner 是Oracle公司从产品8i以后提供的一个实际非常有用的分析工具,使用该工具可以轻松获得Oracle 重做日志文件(归档日志文件)中的具体内容,LogMiner分析工具实际上是由一组PL/SQL包和一些动态视图组成,它作为Oracle数据库的[详细]
-
[bigdata-029] 在centos 7上安装maria
所属栏目:[大数据] 日期:2020-12-31 热度:124
centos 7以上版本支持mysql的另一个分支maria 安装方式如下 正确安装mariadb http://blog.csdn.net/default7/article/details/39138139 http://blog.csdn.net/default7/article/details/41973887 yum install mariadb* service mariadb.service start syst[详细]
-
从小程序的理念,挖掘小程序的方方面面
所属栏目:[大数据] 日期:2020-12-31 热度:171
副标题#e# 小程序发布已过去3天,这个微信放的大招让整个互联网圈高潮了一把。目前业界已有各种小程序的分析和预测,也有很多诸如小程序解放了内存、小程序没用的声音。本文挖掘小程序背后表现出的理念,借这些理念阐述我对小程序的看法,适合的应用、与APP[详细]
-
[bigdata-030] cdh 5.9的impyla操作hiveserver2
所属栏目:[大数据] 日期:2020-12-31 热度:92
参考文献:http://www.aichengxu.com/view/11094184 1. cdh 5.9 2. 开发机已经安装了impyla pip install thrift_sasl pip install sasl 3. 在cdh集群的一个节点启动hiveserver2 3.1 修改/etc/hive/conf.cloudera.hive/hive-site.xml 增加属性 property ? n[详细]
-
HDU 2054 判断大数是否相等
所属栏目:[大数据] 日期:2020-12-31 热度:158
原题链接:http://acm.hdu.edu.cn/showproblem.php?pid=2054 题解:这个题不严谨,仅判断后向0就行,而且不用判正负。 代码: #includeiostreamusing namespace std;const int maxn = 100000;void cleanlastzero(char str[]) { int len = strlen(str),digi[详细]
-
51 Nod 1028 大数乘法 V2 NTT 学习
所属栏目:[大数据] 日期:2020-12-31 热度:180
题意:求两个大数的乘积 解题方法:之前已经用FFT做过了,今天学习一下NTT,记录一下模板。 先所以下NTT,具体的讲解可以看见这里 为了避免FFT在复数和浮点运算中出现精度问题,所以在某些情况下使用NTT。记录一下NTT的模板,其实和FFT很多一样。对了这个[详细]
-
一份价值百万的大数据分析报告如何炼成?
所属栏目:[大数据] 日期:2020-12-31 热度:110
作者 | 江颖 大数据文摘欢迎各类优质稿件 请联系tougao@bigdatadigest.cn 序 曾经,咨询公司一份报告就能收取企业几十万、甚至于上百万。而今,矫枉过正,数据分析报告却常常被企业认为没有任何实际价值。我经常和企业交流,他们告诉我,需要的是能够为他[详细]
-
什么是AI,叫人工智能,和BI,商业智能有什么区别
所属栏目:[大数据] 日期:2020-12-31 热度:125
人工智能(Artificial Intelligence) ,英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。 人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出[详细]
-
如何用大数据实现用户价值的最大化
所属栏目:[大数据] 日期:2020-12-31 热度:130
副标题#e# 来源:易观智库 1 大数据中的用户分析 首先,我们为什么要去做用户分析?面临繁琐的数据之中,需要做什么分析?怎么去提取数据?在建立用户画像模型的过程中,区分用户特征的关键点是什么?应该从哪些方面去寻找用户的特征?其实这个问题扩大化以[详细]
-
算法提高 大数加法
所属栏目:[大数据] 日期:2020-12-31 热度:51
问题描述 输入两个正整数a,b,输出a+b的值。 输入格式 两行,第一行a,第二行b。a和b的长度均小于1000位。 输出格式 一行,a+b的值。 样例输入 4 2 样例输出 6 #includestdio.h#includestring.hvoid fun(int n,int sum[]){int temp,i;for(i=0;in;i++){temp[详细]
-
[bigdata-031] python3+selenium 做抓取
所属栏目:[大数据] 日期:2020-12-31 热度:192
1. 安装 1.1 pip3 install -U selenium 1.2 下载 https://github.com/mozilla/geckodriver/releases/download/v0.13.0/geckodriver-v0.13.0-linux64.tar.gz? 解压缩,然后放到/usr/bin目录 2. 抓取豆瓣 #!/usr/bin/env python3#!-*- coding:utf-8 -*-impor[详细]
-
7本书从小工到数据分析专家
所属栏目:[大数据] 日期:2020-12-30 热度:181
帮助您的书学数据分析的基础知识,并接近成为在数据分析方面的专家。 在过去的几年里,我读了相当数量的书籍上的数据分析,确定了七个,在我看来,其中最好的。一起,这些书的研究数据分析的基[详细]
-
浅谈大数的进制转换
所属栏目:[大数据] 日期:2020-12-30 热度:111
http://www.voidcn.com/article/p-fpnokpkx-yn.html http://www.cnblogs.com/bhlsheji/p/5104558.html http://www.cnblogs.com/phinecos/archive/2009/09/11/1564975.html[详细]
-
太多选择——企业如何选择合适的BI工具?
所属栏目:[大数据] 日期:2020-12-30 热度:92
副标题#e# 文 | keira-杨红 在没认清现状前,企业当然不能一言不合就上BI。 BI不同于一般的企业管理软件,不能简单归类为类似用于提高管理的ERP和WMS,或用于提高企业效率的OA、BPM。BI的本质应该是通过展现数据,用于加强企业各环节的管控,帮助快速制定科[详细]
-
[bigdata-016] python happybase 操作hbase
所属栏目:[大数据] 日期:2020-12-30 热度:76
1. 用happybase库 操作 hbase ??? http://happybase.readthedocs.io/en/latest/ 2. cdh集群的hbase集群有三个节点 ??? hbase的版本是HBase 1.2.0 3. hbase base的log目录小于5g,导致报警,目录在/var/log/hbase,准备清空它。 ?? 删除不需要的log之后,所[详细]
-
22本数据分析、挖掘的好书推荐—绝对干货,不看后悔!
所属栏目:[大数据] 日期:2020-12-30 热度:121
1. 深入浅出数据分析 这书挺简单的,基本的内容都涉及了,说得也比较清楚,最后谈到了R是大加分。 难易程度:非常易。 2.啤酒与尿布 通过案例来说事情,而且是最经典的例子。 3.数据之美 一本介绍性的书籍,每章都解决一个具体的问题,甚至还有代码,对理[详细]
-
分析工具很难选? 看他们如何挖掘大数据价值
所属栏目:[大数据] 日期:2020-12-30 热度:181
副标题#e# 点击上方蓝色字体关注。 您还可以搜索公众号“ D1net”选择关注D1net旗下的各领域(云计算,数据中心,大数据,CIO,企业协作,网络数通,信息安全,企业移动应用,系统集成,服务器,存储,呼叫中心,视频会议,视频监控等)的子公众号。 ======[详细]
-
传统企业在大数据分析上所面临的关键问题
所属栏目:[大数据] 日期:2020-12-30 热度:97
实现数据驱动有两个关键环节:一是数据采集,二是数据分析。对于传统企业来说,往往是这两点都不太具备条件。? 数据采集的痛点 前一段知乎上有人提问,说大家都在讨论大数据与互联网、金融、政府等领域的结合,为什么谈农业大数据的这么少?相关的公司这么[详细]

浙公网安备 33038102330483号