1. 研究目的与意义
数据收集的快速增长导致了信息的新时代。
数据被用于创建更高效的系统,这就是推荐系统发挥作用的地方。
推荐系统是一种信息过滤系统,因为它们可以提高搜索结果的质量并提供与搜索项目更相关或与用户的搜索历史相关的项目。
2. 课题关键问题和重难点
关键问题:在本课题中,我们需要先收集信用卡申请人的的信息,收集到的信息越完整,之后处理信息的难度就越小,也越有利于本课题的研究,所以如何保障信息收集的完整性是本课题所面临的第一个关键性问题。
2机器学习模型复杂度高,需要建立更加完善的监控和迭代优化体系。
难点:1数据准备:积累一个足够大的数据样本,且每个样本有足够的特征数。
3. 国内外研究现状(文献综述)
1.概念定义机器学习:广泛的定义为"利用经验来改善计算机系统的自身性能。
",事实上,由于经验在计算机系统中主要是以数据的形式存在的,因此机器学习需要设法对数据进行分析,这就使得它逐渐成为智能数据分析技术的创新源之一,并且因此而受到越来越多的关注[1]。
数据挖掘:一种解释是识别出海量数据中有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程,顾名思义,数据挖掘就是试图从海量数据中找出有用的知识。
4. 研究方案
四、方案(设计方案、研制方案、研究方案)论证(不少于100字)(系统结构加图数据库方案)系统框架图: (系统框架图)前后端分离的架构使用python语言实现以下几种算法(决策树、和简单的神经网络)前端:用户操作界面可以输入算法所需的用户数据与信息(以H5的形式)后端:与前端用户的交互,实现数据的增删改查,通过所收集的数据进行运算 得出结果后再返回前端核心算法:通过网上数据在上述三种算法中比较出其中最优算法研究方案:参考机器学习的案例,阅读相关算法资料、了解信用评分模型1. 明确目标在实施数据挖掘之前,即需要通过挖掘去解决什么样的问题,这次的问题是帮助解决信用卡分发问题2. 数据搜集当明确目标或需要解决的问题后,下一步就需要准备数据,准备的数据即可以影响到这些问题的解决办法,这一步成为数据搜集过程。
数据搜集过程尤为重要,其决定了后期工作进展的顺利程度。
比如信用卡相关的数据:个人收入情况、年龄和个人资产之类的数据(常用爬虫方法来搜集数据。
5. 工作计划
2022-2022-1学期:第15-16周:完成选题,查阅相关中英文资料,进行相关技术的学习;第17周:与导师沟通进行课题总体规划;第18周:导师下发毕业设计(论文)任务书,学生根据导师的要求进行外文翻译,列出开题报告大纲;第19周:搭建开发环境,撰写开题报告。
2022-2022-2学期:第1-2周:进行课题的需求分析,提交开题报告;第3-4周:收集相关资料,开发工具的整理,根据需求分析设计并建立数据库 ;第5-6周:学习不同算法,找资料,收集数据 清洗数据描述定义数据的意义;尝试用算法分析,尝试选出最优算法;完成系统的前端实现;第7-8周:完成系统的后端实现;提交毕业设计论文提纲给指导老师审阅;第9-11周:完成系统前后端的联调,能够运行系统;完成毕业论文初稿;第12周:在教师的指导下对撰写的论文进行修改,提交论文终稿及合格的论文检测报告、毕业设计(论文)资料装袋;第13-14周:筹备毕业答辩相关事宜,制作参加毕业答辩的演示课件。
参加毕业答辩,并提交全部文档和成果材料。
