零起点Python机器学习快速入门【2.0】

BinaryStarXin

6人浏览 · 2026-06-13 21:12:34

BinaryStarXin · 2026-06-13 21:12:34 发布

6.6 案例源码

本章包括以下案例程序。
 案例 6-1：逻辑回归算法，文件名是 zai201_mx_log.py。
 案例 6-2：朴素贝叶斯算法，文件名是 zai202_mx_nb.py。
 案例 6-3： KNN 近邻算法，文件名是 zai203_mx_knn.py。
 案例 6-4：随机森林算法，文件名是 zai204_mx_rf.py。

案例 6-1：逻辑回归算法

案例 6-1：逻辑回归算法，文件名是 zai201_mx_log.py，源码如下。

#coding=utf-8
'''
Created on 2016.12.25
TopQuant-极宽量化系统·培训课件-配套教学 python 程序
@ www.TopQuant.vip www.ziwang.com
'''
import pandas as pd
import sklearn
from sklearn import datasets, linear_model
from sklearn.cross_validation import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn import metrics
from sklearn.model_selection import cross_val_predict
#
import zsys
import ztools as zt
import ztools_str as zstr
import ztools_web as zweb
import ztools_data as zdat
import ztop_ai as zai
import zpd_talib as zta
#
#-----------------------
#1
fs0='dat/iris_'
print('\n1# init， fs0,',fs0)
x_train=pd.read_csv(fs0+'xtrain.csv',index_col=False);
y_train=pd.read_csv(fs0+'ytrain.csv',index_col=False);
x_test=pd.read_csv(fs0+'xtest.csv',index_col=False)
y_test=pd.read_csv(fs0+'ytest.csv',index_col=False)
df9=x_test.copy()
#2
print('\n2# 建模')
mx =zai.mx_log(x_train.values,y_train.values)
#3
print('\n3# 预测')
y_pred = mx.predict(x_test.values)
df9['y_predsr']=y_pred
df9['y_test'],df9['y_pred']=y_test,y_pred
df9['y_pred']=round(df9['y_predsr']).astype(int)
#4
df9.to_csv('tmp/iris_9.csv',index=False)
print('\n4# df9')
print(df9.tail())
#5
dacc=zai.ai_acc_xed(df9,1,False)
print('\n5# mx:mx_sum,kok:{0:.2f}%'.format(dacc))
#-----------------------
print('\nok!')

案例 6-2：朴素贝叶斯算法

案例 6-2：朴素贝叶斯算法，文件名是 zai202_mx_nb.py，源码如下。

#coding=utf-8
'''
Created on 2016.12.25
TopQuant-极宽量化系统·培训课件-配套教学 python 程序
@ www.TopQuant.vip www.ziwang.com
'''
import pandas as pd
import sklearn
from sklearn import datasets, linear_model
from sklearn.cross_validation import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn import metrics
from sklearn.model_selection import cross_val_predict
#
import zsys
import ztools as zt
import ztools_str as zstr
import ztools_web as zweb
import ztools_data as zdat
import ztop_ai as zai
import zpd_talib as zta
#
#-----------------------
#1
fs0='dat/iris_'
print('\n1# init， fs0,',fs0)
x_train=pd.read_csv(fs0+'xtrain.csv',index_col=False);
y_train=pd.read_csv(fs0+'ytrain.csv',index_col=False);
x_test=pd.read_csv(fs0+'xtest.csv',index_col=False)
y_test=pd.read_csv(fs0+'ytest.csv',index_col=False)
df9=x_test.copy()
#2
print('\n2# 建模')
mx =zai.mx_bayes(x_train.values,y_train.values)
#3
print('\n3# 预测')
y_pred = mx.predict(x_test.values)
df9['y_predsr']=y_pred
df9['y_test'],df9['y_pred']=y_test,y_pred
df9['y_pred']=round(df9['y_predsr']).astype(int)
#4
df9.to_csv('tmp/iris_9.csv',index=False)
print('\n4# df9')
print(df9.tail())
#5
dacc=zai.ai_acc_xed(df9,1,False)
print('\n5# mx:mx_sum,kok:{0:.2f}%'.format(dacc))
#-----------------------
print('\nok!')

案例 6-3： KNN近邻算法

案例 6-3： KNN 近邻算法，文件名是 zai203_mx_knn.py，源码如下。

#coding=utf-8
'''
Created on 2016.12.25
TopQuant-极宽量化系统·培训课件-配套教学 python 程序
@ www.TopQuant.vip www.ziwang.com
'''
import pandas as pd
import sklearn
from sklearn import datasets, linear_model
from sklearn.cross_validation import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn import metrics
from sklearn.model_selection import cross_val_predict
#
import zsys
import ztools as zt
import ztools_str as zstr
import ztools_web as zweb
import ztools_data as zdat
import ztop_ai as zai
import zpd_talib as zta
#
#-----------------------
#1
fs0='dat/iris_'
print('\n1# init， fs0,',fs0)
x_train=pd.read_csv(fs0+'xtrain.csv',index_col=False);
y_train=pd.read_csv(fs0+'ytrain.csv',index_col=False);
x_test=pd.read_csv(fs0+'xtest.csv',index_col=False)
y_test=pd.read_csv(fs0+'ytest.csv',index_col=False)
df9=x_test.copy()
#2
print('\n2# 建模')
mx =zai.mx_knn(x_train.values,y_train.values)
#3
print('\n3# 预测')
y_pred = mx.predict(x_test.values)
df9['y_predsr']=y_pred
df9['y_test'],df9['y_pred']=y_test,y_pred
df9['y_pred']=round(df9['y_predsr']).astype(int)
#4
df9.to_csv('tmp/iris_9.csv',index=False)
print('\n4# df9')
print(df9.tail())
#5
dacc=zai.ai_acc_xed(df9,1,False)
print('\n5# mx:mx_sum,kok:{0:.2f}%'.format(dacc))
#-----------------------
print('\nok!')

案例 6-4：随机森林算法

案例 6-4：随机森林算法，文件名是 zai204_mx_rf.py，源码如下。

#coding=utf-8
'''
Created on 2016.12.25
TopQuant-极宽量化系统·培训课件-配套教学 python 程序
@ www.TopQuant.vip www.ziwang.com
'''
import pandas as pd
import sklearn
from sklearn import datasets, linear_model
from sklearn.cross_validation import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn import metrics
from sklearn.model_selection import cross_val_predict
#
import zsys
import ztools as zt
import ztools_str as zstr
import ztools_web as zweb
import ztools_data as zdat
import ztop_ai as zai
import zpd_talib as zta
#
#-----------------------
#1
fs0='dat/iris_'
print('\n1# init， fs0,',fs0)
x_train=pd.read_csv(fs0+'xtrain.csv',index_col=False);
y_train=pd.read_csv(fs0+'ytrain.csv',index_col=False);
x_test=pd.read_csv(fs0+'xtest.csv',index_col=False)
y_test=pd.read_csv(fs0+'ytest.csv',index_col=False)
df9=x_test.copy()
2
print('\n2# 建模')
mx =zai.mx_forest(x_train.values,y_train.values)
#3
print('\n3# 预测')
y_pred = mx.predict(x_test.values)
df9['y_predsr']=y_pred
df9['y_test'],df9['y_pred']=y_test,y_pred
df9['y_pred']=round(df9['y_predsr']).astype(int)
#4
df9.to_csv('tmp/iris_9.csv',index=False)
print('\n4# df9')
print(df9.tail())
#5
dacc=zai.ai_acc_xed(df9,1,False)
print('\n5# mx:mx_sum,kok:{0:.2f}%'.format(dacc))
#-----------------------
print('\nok!')

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

小红书多工具集成模式实战：如何连接 CLI/MCP/API 构建统一工作流

/ 新增工具只需实现统一接口本文详细解析了多工具集成的架构设计与实现方案，涵盖 CLI、MCP、API 三种技术形态的集成模式，以及工具链编排、状态管理、错误处理和降级策略。这种设计使得系统能够灵活整合各种外部工具，构建高效的自动化工作流。

2048 AI社区

GitHub 热门项目日报 | 2026-06-12 ~ 2026-06-13

在代码的洪流中，每48小时都是一次技术的微型大爆炸。2026年6月的第二周，GitHub的热门榜单再次向我们揭示了开发者社区的脉搏：Python与JavaScript的“双雄对决”并未因时间推移而褪色，反而在AI应用落地与Web全栈进化的交汇点上，迸发出更为激烈的火花。本周，25个高热度项目不仅刷新了Star记录，更重新定义了效率与体验的边界。从智能代理的自动化突破到前端框架的性能极限压榨，我们看

2048 AI社区

OpenClaw 企业级 Agent 平台技术方案

本方案基于分层技能管理用户级记忆系统沙箱池化技术，构建了一个高并发、高隔离、可扩展的企业级 Agent 平台。要点核心思路架构模式微服务 + 多智能体联邦技能管理三级分层（领域 → 目录 → 原子技能），JuiceFS 统一存储分发记忆管理基于 MIRIX 框架，向量库 + Redis + 定期压缩归档沙箱隔离Docker + K8s，池化管理，状态转换（休眠/激活/销毁）统一存储JuiceFS