0%

服务外包机器学习项目总结

摘要

本文主要记录了作者参加2020年服务外包大赛,开发A10项目的学习过程和在这途中遇到困难,以及解决困难的相关办法。

关键词:机器学习;数据分析;

持续更新中

项目介绍

业务背景

“一贷通”是公司“一平七通”发展战略中的“一通”之一,“一贷通”的业务目标旨在积极采用大数据、机器学习、人工智能等先进的金融科技技术,汇聚各个政府委办局、区域内金融机构、互联网等多渠道的基础数据,搭建一涵盖各金融业务数据的多功能的数字金融科技服务平台,形成科学、客观、可靠的中小微企业信用评分体系,着力解决中小企业“融资难、融资贵”的问题。企业多源数据、多维度的深入挖掘是为企业构建企业画像、建立企业信用评分体系的前提基础,从企业的企业背景、经营能力、经营风险、发展状况等层面对企业进行群体划分,企业划分结果中的每一个企业簇群体都要形成较明显的标签标示,为后续企业画像构建、企业信用评分体系构建提供辅助。

问题说明

以某一地市的小微企业为研究对象,以该地市小微企业覆盖企业背景、企业稳定性、企业经营能力、企业经营风险、司法风险、信用风险等多个方面的数据作为数据来源。建立一种无监督的分类模型,利用小微企业包含的特征维度信息,对小微企业进行簇划分,划分的每一个簇都有有效的特征或者标签去描述该簇的特征,每个簇之间形成较为明显的划分界限,即最终形成企业合理的划分。

项目目标

追求企业无标识脱敏数据的有效划分及每个簇划分标签的合理有效且可区分:

1.针对无标识的企业数据进行数据预处理,特征備选,特征提取等形成有效的训练样例及特征;

2.针对提取的有效特征选择合适的无监督分类方法对小微企业数据进行分类,进行模型训练,模型要求实现小微企业群体的有效划分;

3.针对小微企业划分后各簇提取显著标签进行该簇的描述,要求标签合理且有效;

项目结构图

1
2
3
4
5
6
7
8
9
2020_A10_FWWB:
├─code # 代码
│ ├─lib # 机器学习
│ └─web # 网页端
├─datas # 数据
├─docs # 文档
├─mindmap # 脑图
├─output # 结果输出
└─prototype # 概念图

题目分析

产品设计

机器学习开发

网页端开发