关注 0 人关注

暂无介绍

35

破冰方案!焦虑有啥用?VIP会员2020,全网数据分析好课一应俱全!

破冰方案!焦虑有啥用?VIP会员2020,全网数据分析好课一应俱全!
34

透过数据理性分析当下新型肺炎疫情形势

33

春节被催婚,2020全国各地彩礼地图告诉你结婚有多难

春节被催婚,2020全国各地彩礼地图告诉你结婚有多难
37

解决大数据量下的各种报表使用问题,用永洪数据集市数据集

一招教你解决大数据量下的各种报表使用问题

2、新建作业

在调度作业中新建任务,其中类型设置为:增量导入数据,数据集为上一步创建的TEST_YH的SQL数据集,文件夹为存放文件的名称,最后我们选择追加数据。

一招教你解决大数据量下的各种报表使用问题

在任务最下方的脚本中设置可以动态获取昨天日期的参数参数,setMeta("search_data_index",formatDate(a,"yyyy-MM-dd")) 是用来给数据集市文件设定属性的,在数据集市数据集中可通过过滤条件查看这个属性。

file = formatDate(a,"yyyy-MM-dd") 是创建一个数据集市文件的文件名。

一招教你解决大数据量下的各种报表使用问题


3、生成文件

在调度任务中运行此作业,就可以生成文件了。


一招教你解决大数据量下的各种报表使用问题

我们还可以进一步在管理系统下监控预警中的数据集市文件信息统计中进一步查看上一步生成的文件。

解决大数据量下的各种报表使用问题,用永洪数据集市数据集
18

数字化转型大势下,企业如何实现数据管控?

数字化转型大势下,企业如何实现数据管控?
16

如何用python在工作中“偷懒”?

19

超强数据源覆盖能力,永洪科技BI产品全面支持Greenplum

16

求武陵山片区地图,arcgis可以直接操作的那种,谢谢!

10

一文讲解机器学习算法中的共线性问题

  

作者 | 宋老师

来源 | JSong的数据科学小站

多重共线性是使用线性回归算法时经常要面对的一个问题。在其他算法中,例如决策树和贝叶斯,前者的建模过程是逐步递进,每次拆分只有一个变量参与,这种建模机制含有抗多重共线性干扰的功能;后者干脆假定变量之间是相互独立的,因此从表面上看,也没有多重共线性的问题。但是对于回归算法,不论是一般回归,逻辑回归,或存活分析,都要同时考虑多个预测因子,因此多重共线性是不可避免需要面对的,在很多时候,多重共线性是一个普遍的现象。在构造预测模型时如何处理多重共线性是一个比较微妙的议题。既不能不加控制,又不能一刀切,认为凡是多重共线性就应该消除。

1、共线性的原理

假设有k个自变量的多元线性回归模型:

一文讲解wordsbank_match location='/map/jiqixuexi/'机器学习/wordsbank_match算法中的共线性问题

其中误差项是一个期望值为0且服从正态分布的随机变量:

一文讲解机器学习算法中的共线性问题
12

轻松构建复杂数据集,永洪自服务数据查询功能详解

轻松构建复杂数据集,永洪自服务数据查询功能详解