-
第10章-基于树的方法(1)-生成树
所属栏目:[大数据] 日期:2021-03-16 热度:109
副标题#e# 原文参考:https://onlinecourses.science.psu.edu/stat857/node/22 一,本章简介 1,本章主要学习目标 理解决策树的基本概念 理解构成决策树的三个基本元素 理解’不纯度’及其他度量公式的定义 知道如何估计每个树节点的各个所属分类的后验概率[详细]
-
数据处理1:一个中型数据的数据处理平台构建
所属栏目:[大数据] 日期:2021-03-16 热度:142
数据是这个样子的 大概一共有两万多行,我需要对每一行进行逗号的分隔解析,然后把数据重新输出 方法是把它存为文件,然后通过文件读取的方式去读取这些数据,读取一行然后进行处理让其变成单个字符串并进行显示 我这里用的是结构体存储的方法,并且分割的[详细]
-
大数据分析平台搭建教程:基于Apache Zeppelin Notebook和R的交
所属栏目:[大数据] 日期:2021-03-16 热度:121
介绍 这篇文章的目的是帮助您开始使用 Apache Zeppelin Notebook,它可以满足您用R做数据科学的需求。Zeppelin 是一个提供交互数据分析且基于Web的笔记本。方便你做出可数据驱动的、可交互且可协作的精美文档,并且支持多种语言,包括 Scala(使用 Apache S[详细]
-
四大主流开源BI商业智能平台对比评测
所属栏目:[大数据] 日期:2021-03-16 热度:60
概述:本文对主流的四款开源BI商业智能平台进行了对比,主要从三方面入手,文档、演示和架构体系。 一、文档篇 完善的文档对平台的学习和使用是非常有用的,也是判断平台是否优秀的一个最直观的方法,所以我们有理由来比较一下四个平台的文档。 openI的文[详细]
-
HDU 1502 三维dp加大数
所属栏目:[大数据] 日期:2021-03-16 热度:174
F[a][b][c]=F[a-1][b][c]+F[a][b-1][c]+F[a][b][c-1]; a=b=c; package zzz;import java.math.BigInteger;import java.util.Scanner;public class Main {public static void main(String args[]){Scanner cin=new Scanner(System.in);BigInteger a[][][]=ne[详细]
-
Bi-shoe and Phi-shoe【lightoj1370】——欧拉数
所属栏目:[大数据] 日期:2021-03-16 热度:107
Bamboo Pole-vault is a massively popular sport in Xzhiland. And Master Phi-shoe is a very popular coach for his success. He needs some bamboos for his students,so he asked his assistant Bi-Shoe to go to the market and buy them. Plenty of[详细]
-
上机题目(初级)-大数求和
所属栏目:[大数据] 日期:2021-03-16 热度:183
代码如下: import java.io.*;import java.util.*;public class Main {public static void main(String[] args) {Scanner cin = new Scanner(new BufferedInputStream(System.in));String add1 = cin.nextLine();String add2 = cin.nextLine();java.math.B[详细]
-
大数加,减,乘,取余一起
所属栏目:[大数据] 日期:2021-03-16 热度:181
#includeiostream#includestring#define LEN 100using namespace std;void add(char a[],char b[]){/*********************装换*********************/int num1[LEN];int num2[LEN];for (int i = 0; i LEN; i++){num1[i] = 0;num2[i] = 0;}int lena = strl[详细]
-
余弦相似性算法
所属栏目:[大数据] 日期:2021-03-16 热度:199
余弦相似性算法的具体介绍参考:http://www.ruanyifeng.com/blog/2013/03/cosine_similarity.html 下面是我根据上边的介绍进行的java语言的实现: import java.io.IOException;import java.io.StringReader;import java.util.Collections;import java.util.C[详细]
-
POJ 3101 素数分解+大数
所属栏目:[大数据] 日期:2021-03-16 热度:59
题目 Astronomy Time Limit: 2000MS Memory Limit: 65536K Total Submissions: 5643 Accepted: 1252 Description There are n planets in the planetary system of star X. They orbit star X in circular orbits located in the same plane. Their tangen[详细]
-
CodeForces - 582A GCD Table (map大数操作amp;gcd)好题
所属栏目:[大数据] 日期:2021-03-16 热度:71
CodeForces - 582A GCD Table SubmitStatus Description The GCD table G of size n ?×? n for an array of positive integers a of length n is defined by formula Let us remind you that the greatest common divisor (GCD) of two positive integers[详细]
-
HNOI2016 大数(number)
所属栏目:[大数据] 日期:2021-03-16 热度:108
分析 首先,我们要知道取模的几个性质: 设 p=a+b , q=a*b 1. p%x=(a%x+b%x)%x 2. q%x=(a%x*b%x)%x 知道这两个性质之后,我们首先输入进要模的数 x 和字符串 s ,处理出一个后缀数组 m ,和一个 po 数组, m[i] 表示字符串中从前往后数的第 i 位到结尾所[详细]
-
HNOI2016 大数(number)lt;莫队gt;
所属栏目:[大数据] 日期:2021-03-16 热度:180
题目 分析 一道典型的莫队。 先预处理出后缀,即f[i]表示i~(n-1) mod p 的值. 但p的值不小,显然不能直接存,加一个离散化。 观察题目,发现一串数s(l~r)整除p满足s(l~n-1)%p==s(r+1~n-1)%p 但p值为2或5不满足这个性质需要特判(不过数据中好像没有,于是[详细]
-
FZU- Problem 1147 Tiling,递推坑题,大数水过~~
所属栏目:[大数据] 日期:2021-03-16 热度:115
副标题#e# Problem 1147 Tiling Time Limit: 1000 mSec?? ??Memory Limit : 32768 KB http://acm.fzu.edu.cn/problem.php?pid=1147 ?Problem Description In how many ways can you tile a 2x n ?rectangle by 2x1 or 2x2 tiles? Here is a sample tiling o[详细]
-
NBUT1461 数字整除(大数处理,减法、除法)
所属栏目:[大数据] 日期:2021-03-16 热度:169
数字整除 Description 定理:把一个至少两位的正整数的个位数字去掉,再从余下的数中减去个位数的5倍。当且仅当差是17的倍数时,原数也是17的倍数 。 例如,34是17的倍数,因为3-20=-17是17的倍数;201不是17的倍数,因为20-5=15不是17的倍数。输入一个正[详细]
-
大数整除(大数mod)
所属栏目:[大数据] 日期:2021-03-16 热度:143
Description 定理:把一个至少两位的正整数的个位数字去掉,再从余下的数中减去个位数的5倍。当且仅当差是17的倍数时,原数也是17的倍数 。 例如,34是17的倍数,因为3-20=-17是17的倍数;201不是17的倍数,因为20-5=15不是17的倍数。输入一个正整数 n ,[详细]
-
求大数的阶乘和末尾0个数的计算
所属栏目:[大数据] 日期:2021-03-16 热度:132
求末尾0的个数: 至于末尾有多少个0,这个简单,0的个数为(其中的“/”是取整除法): 例子:(1000的阶乘末尾0的个数)?? ? ? ? 1000 ? / ? 5 ? + ? 1000 ? / ? 25 ? + ? 1000 ? / ? 125 ? + ? 1000 ? / ? 625 ?? ? = ? 200 ? + ? 40 ? + ? 8 ? + ? 1 ??[详细]
-
R语言绘制文字云
所属栏目:[大数据] 日期:2021-03-15 热度:112
差不多一年没有怎么认真写过博客了,最近要做毕业设计,记录一下有关实验。参考实验楼上一个实验。主要学习使用分词包 Rwordseg 对莎士比亚的名著《仲夏夜之梦》中的内容进行单词频数统计,提取关键词,并进行数据清洗,最后使用包 wordcloud 根据关键词出[详细]
-
K 大数查询
所属栏目:[大数据] 日期:2021-03-15 热度:148
题目大意 有N个集合,初始为空。有M个操作, 修改操作:编号范围在l~r的集合都加入一个数值为a的数, 询问操作:编号范围在l~r的集合数值为第k大的数。 n,m=50000,|a|=n,k 树套树 当然可行,但我不会 考虑离线——整体二分 L,R表示数值的区间,mid=(L+R)[详细]
-
大数 Astar-Round1 Problem B
所属栏目:[大数据] 日期:2021-03-15 热度:135
题目 2016"百度之星" - 资格赛(Astar Round1) http://bestcoder.hdu.edu.cn/contests/contest_showproblem.php?cid=690pid=1002 Problem Description 度熊面前有一个全是由1构成的字符串,被称为全1序列。你可以合并任意相邻的两个1,从而形成一个新的序[详细]
-
R语言数据处理——tidyr包
所属栏目:[大数据] 日期:2021-03-15 热度:92
????在实际进行数据分析的过程中,我们常需要对数据进行一些相应的整理,“ tidyr 包”中的 gather(宽数据转为长数据)、 spread(长数据转为宽数据)、 unit(多列合并为一列)、 separate(将一列分离为多列)这四个函数为我们的数据整理提供了极大的便[详细]
-
R文本挖掘 | 如何在用户词库中添加搜狗词典?
所属栏目:[大数据] 日期:2021-03-15 热度:77
写 在前面 亲爱的小伙伴们!阔别大家将近10天,是不是等得有些着急了呢?本期大猫课堂将继续《R文本挖掘》系列,上节课中已经教大家 如何用jiebaR分词包进行分词,本期将教大家一个更加进阶的分词功能: 把搜狗专业词库添加进自己的用户自定义词典中。 稍[详细]
-
lt;大数处理gt; 2016百度之星第二题
所属栏目:[大数据] 日期:2021-03-15 热度:175
链接:http://bestcoder.hdu.edu.cn/contests/contest_showproblem.php?cid=690pid=1002 Problem B ? ?Accepts: 2483 ? ?Submissions: 9088 ?Time Limit: 2000/1000 MS (Java/Others) ? ?Memory Limit: 65536/65536 K (Java/Others) Problem Description[详细]
-
2016#34;百(sha)度(bi)之星#34;-资格赛(Astar Round 1)题解
所属栏目:[大数据] 日期:2021-03-15 热度:52
副标题#e# 昨天中午一年一坑人的百(sha)度(bi)之星又开赛了,当然正赛的话是下周开始,最先开始的是资格赛。资格赛嘛,过一题就算过了,所以也不管那么多了,就在比赛结束前把题解贴出来了。然后呢,果然不愧是刚刚被政府找去谈话的百度,秉承着坑死你[详细]
-
HDOJ1002 大数相加
所属栏目:[大数据] 日期:2021-03-15 热度:142
pre name="code" class="java"import java.math.BigInteger;import java.util.Scanner;public class Main{ public static void main(String[] args) { Scanner cin = new Scanner(System.in); BigInteger a,i,t; int kase=0; int ts; ts=cin.nextInt(); in[详细]

浙公网安备 33038102330483号