资源列表
[数据挖掘] TianCheng-master_chusai_qingyu
说明:2018年甜橙金融杯大数据建模大赛初赛方案:通过追踪时间、设备、ip和经纬度等属性的变化来建模判断UID是否为黑产链 ## 代码说明: - gen_stat_feat.py 统计特征 - gen_w2v_feat.py word2vec特征 - lgb_train.py lgb训练模型 两份特征建模加权8:2比例融合即可0.792+,单独统计特征加UID列建模即可0.795。(The prelimi<PBMASTERS> 在 2025-02-23 上传 | 大小:7kb | 下载:0
[数据挖掘] 用Python写网络爬虫
说明:Python爬虫教程及项目实战,你值得拥有。(Python crawler tutorial and project practice)<WORLDzhang> 在 2025-02-23 上传 | 大小:9.42mb | 下载:0
[数据挖掘] Python for Data Analysis
说明:利用python进行数据分析,英文书籍,从pandas库的数据分析工具开始利用高性能工具对数据进行加载、清理、转换、合并以及重塑;利用matpIotlib创建散点图以及静态或交互式的可视化结果;利用pandas的groupby功能对数据集进行切片、切块和汇总操作;处理各种各样的时间序列数据。(Starting from the data analysis tools of pandas database, high performanc<逗你玩H> 在 2025-02-23 上传 | 大小:12.18mb | 下载:0
[数据挖掘] A sentiment analysis program
说明:A sentiment analysis program.Can select different model to analysis sentiment.These model contain Random Forest,bagged tree,Naive Bayes,SVM.<283619937@qq.com> 在 2019-09-04 上传 | 大小:25.95mb | 下载:0
[数据挖掘] k-means-for-iris
说明:利用K均值聚类对鸢尾花样本进行聚类的matlab程序,包含源代码、样本数据、聚类结果(The matlab program of clustering iris samples by K-means clustering, including source code, sample data and clustering results)<麻衣蚂蚁> 在 2025-02-23 上传 | 大小:28kb | 下载:0
[数据挖掘] ml_homework_1
说明:此代码使用python中的sklearn实现了对uci中spambase垃圾邮件数据集的分类(This code uses sklearn in Python to realize the classification of spam dataset in UCI)<本初子午> 在 2025-02-23 上传 | 大小:1kb | 下载:0
[数据挖掘] Monero Desktop Miner
说明:A simple monero miner<ivan4o.iu.varna@gmail.com> 在 2019-11-17 上传 | 大小:907.3kb | 下载:0
[数据挖掘] stock-prediction-master
说明:SARIMA时序预测代码示例。无论我们是想预测金融市场的趋势还是用电量,时间都是我们模型中必须考虑的一个重要因素。例如,预测一天中什么时候会出现用电高峰是很有趣的,可以以此为依据调整电价或发电量。(SARIMA time series prediction code example)<Nyam0r1> 在 2025-02-23 上传 | 大小:617kb | 下载:0
[数据挖掘] node2vec-master-python3
说明:斯坦福大学的node2vec模型,做图嵌入的,说明很详细分享一下,,原文件是Python2做的,我改的Python3的,分享一下(The node2vec model of Stanford University is embedded in the diagram, and the descr iption is shared in detail. The original file is made by Python 2, and<ytdhblk> 在 2025-02-23 上传 | 大小:9kb | 下载:0