首页后端开发Pythonpython 泰坦尼克

python 泰坦尼克

时间2023-07-26 05:59:03发布访客分类Python浏览114
导读:Python 是一种流行的高级编程语言,它在数据科学和机器学习等领域具有很强的生产力。 泰坦尼克号是 20 世纪初期的一次著名船难,让许多人失去了宝贵的生命。 数据分析和机器学习的爱好者经常使用泰坦尼克号数据集作为测试数据集,并尝试在 Py...

Python 是一种流行的高级编程语言,它在数据科学和机器学习等领域具有很强的生产力。 泰坦尼克号是 20 世纪初期的一次著名船难,让许多人失去了宝贵的生命。 数据分析和机器学习的爱好者经常使用泰坦尼克号数据集作为测试数据集,并尝试在 Python 中使用该数据集来构建机器学习模型,以预测不同情况下的乘客生存率。

#导入必要的模块和库import pandas as pdfrom sklearn.tree import DecisionTreeClassifier#读取数据集data = pd.read_csv("titanic.csv")#看看数据的样子(前5行)print(data.head())#删除无用的列(例如:乘客ID、姓名、船票编号等)data = data.drop(["PassengerId","Name","Ticket","Cabin"],axis=1)#处理缺失值data = data.dropna()#将数据集分成特征集和目标集X = data.drop("Survived",axis=1)y = data["Survived"]#使用决策树算法构建模型model = DecisionTreeClassifier()model.fit(X,y)#测试一下模型print(model.predict([[3,1,22,1,0,7.25,0]]))

上面的 Python 代码演示了如何使用 pandas 库中的 read_csv() 函数读取泰坦尼克号数据集。然后,将数据集拆分成特征集和目标集,并使用决策树算法构建分类模型。最后,我们使用 predict() 函数在测试数据上测试了模型的准确性。

声明:本文内容由网友自发贡献,本站不承担相应法律责任。对本内容有异议或投诉,请联系2913721942#qq.com核实处理,我们将尽快回复您,谢谢合作!


若转载请注明出处: python 泰坦尼克
本文地址: https://pptw.com/jishu/330324.html
python 注销快捷键 css图片长框百分比(css图片长框百分比大小)

游客 回复需填写必要信息