您的当前位置：首页一种自动标定试题知识点的方法[发明专利]

一种自动标定试题知识点的方法[发明专利]

来源：华佗小知识

(19)中华人民共和国国家知识产权局

(12)发明专利申请

(10)申请公布号 CN 111126051 A(43)申请公布日 2020.05.08

(21)申请号 201911113466.1(22)申请日 2019.11.14

(71)申请人临沂市拓普网络股份有限公司

地址 276000 山东省济南市经济技术开发

区沃尔沃路66号(72)发明人张金刚　甘尼什库玛　巴布　于光　

吕玉茂　(74)专利代理机构广州文衡知识产权代理事务

所(普通合伙) 44535

代理人王茜(51)Int.Cl.

G06F 40/279(2020.01)G06F 16/11(2019.01)

权利要求书2页说明书4页附图1页

(54)发明名称

一种自动标定试题知识点的方法(57)摘要

本发明公开了一种自动标定试题知识点的方法，包括以下步骤，S1、输入试题，python程序输入word文档试题；S2、提取知识点，采用的神经网络提取知识点；S3、知识点矩阵和向量转化，题干的正方形矩阵和一个知识点向量一一对应；S4、保存模型，训练结果，最后使用神经网络的Relu激活函数进行训练，建立模型，对题目预测选取的程序中载入上述建立的模型；本发明使用卷积神经网络可以准确、快速地识别题目考察的知识点，提高的准确程度，与人工进行标定相比，使用计算机标定可以大大节省时间和人力；可以避免人工标定中对同类型知识点有不同习惯称呼造成知识点混乱的问题。

CN 111126051 ACN 111126051 A

权　利　要　求　书

1/2页

1.一种自动标定试题知识点的方法，其特征在于：包括如下步骤：S1、输入试题，首先需要准备好一定数量并且标定好了知识点的试题，然后将这些标定好知识点的试题输入到python程序中，且这些试题需要采用word文档格式进行保存，并且在python程序中会读取这些试题的word文档；

S2、提取知识点，这些标定好知识点题目的word文档会被根据相应的检测格式识别出试题中的题干和对应的知识点，并且对题干和对应的知识点检测采用的神经网络由两个卷积层检测进行，并且将题干和对应的知识点分别存储成csv格式的文件，再通过手动方式将csv文件格式转为xls文件格式，并且将文件文档中的逗号和句号替换为分隔符；

S3、知识点矩阵和向量转化，然后读取处理后且标定好知识点题干的xls文件后，将题干中的每一行转化为一个正方形矩阵，并且当一行长度不能被开方时，用“0”补足，迭代此过程，直至能被开方；且每一个表示题干的正方形矩阵和一个知识点向量一一对应，和图像识别时中的图像标签对应一致；进而绘制成题干矩阵和知识点向量为训练材料；

S4、保存模型，训练结果，最后使用神经网络的Relu激活函数进行训练，且Relu激活函数的表达式为F(x)＝max(0，X)，最终可以建立特征-标签，也就是一个给定的带有知识点标签的题目存在的特定字词和知识点之间对应关系的模型，在对题目预测选取的程序中载入上述建立的模型，然后就可以自动识别新题目的知识点。

2.根据权利要求1所述的一种自动标定试题知识点的方法，其特征在于：所述步骤S1中将标定好知识点的题目使用word文件格式进行保存，并且通过python程序对word文件进行读取内容。

3.根据权利要求1所述的一种自动标定试题知识点的方法，其特征在于：所述步骤S2中神经网络由两个卷积层，一个全连接层和一个输出层构成，在卷积层中，全连接层会将代表题干的正方形矩阵被分割为较小的正方形，程序将遍历每一个小正方形矩阵以发现各种特征的规律，输出层中包含题干是否包含某知识点的权值，将该值标准化，并约为0和1即可得到题目包含的知识点。

4.根据权利要求1所述的一种自动标定试题知识点的方法，其特征在于：所述步骤S2中为了方便对文件的识别将csv文件格式转为xls文件格式，并且将文件中的逗号和句号进行用分隔符进行替换。

5.根据权利要求1所述的一种自动标定试题知识点的方法，其特征在于：所述步骤S3中为了实现知识之间的向量关系，将题目的题干和知识点分别转化成知识矩阵，并且题干与知识点可以实现一对一的关系和一对多的关系。

6.根据权利要求1所述的一种自动标定试题知识点的方法，其特征在于：所述步骤S3中为了实现将题干转化成正方形矩阵，且对于不能够实现开方的题干长度，需要在题干的后方一“0”进行补充进行开方。

7.根据权利要求1所述的一种自动标定试题知识点的方法，其特征在于：所述步骤S4中Relu函数是一个激活函数,能够克服梯度消失的问题，以及加快训练的速度，它的作用是如果计算出的值小于0，就让它等于0，否则保持原来的值不变，这样就简单粗暴地强制某些数据为0的方法，然而经实践证明，训练后的网络完全具备适度的稀疏性。

8.根据权利要求1所述的一种自动标定试题知识点的方法，其特征在于：所述S4需要将题干知识点之间建立的向量模型输入到程序中，然后程序可以通过向量模型实现对大量题

CN 111126051 A

权　利　要　求　书

2/2页

目进行题干和知识点的选取，实现对题目中知识点的确定，并且进行对题目的选取。

CN 111126051 A

说　明　书

一种自动标定试题知识点的方法

1/4页

技术领域

[0001]本发明涉及计算机科学技术领域，具体为一种自动标定试题知识点的方法。背景技术

[0002]在一场测验中，每一道试题都对应着一个或多个知识点。通过完成这些试题，教师可以在一定程度上了解学生对各知识点的掌握情况。在线测验、阅卷越来越普遍的情况下，计算机已经可以做到部分替代教师的工作，根据特定的算法，完成在线测验的学生可以获取关于自身知识点掌握情况的完整报告。但其中还存在一个严重的问题：在线测验使用的试题必须提前标定好考察的知识点。这一步通常由富有经验的资深教师完成，但也意味着能够完成这项工作的人力及其稀缺，同时由于在线题库中题目数量庞大，完成题目的知识点标定需要花费大量的时间。

[0003]本发明是基于卷积神经网络识别图像时，针对目标图片可以提取出其中的特征这一功能实现的。在判断图像中是否出现某一物体时，卷积神经网络会判断图像上是否有符合该物体的一些特征，是否可以将它和同类物体区分开，例如，识别动物时，动物的眼睛、耳朵，或识别车辆时，车辆的轮子、商标等。本发明中对试题知识点的标定也正是基于卷积神经网络的工作原理，将试题转化为类似图像的正方形矩阵并寻找其中特征来实现的，当前对在线测验试题标注只能由教师完成，需要花费大量的时间，同时由于工作量非常大，很容易产生失误，而且由于不同教师教学经验、习惯的不同，知识点没有统一的命名，可能导致存在大量意义相同的重复知识点，增大在线测验的计算量，使结果精确程度下降。[0004]本发明采用机器学习的方式，使用卷积神经网络，只需要使用一定数量的标定完成的题目作为学习材料，经过训练后神经网络可以自动判断新题目考察了哪些知识点，不仅节省大量人力，并且因为知识点的命名方式也可以得到统一。发明内容

[0005]本发明的目的在于提供一种自动标定试题知识点的方法，具有使用卷积神经网络可以准确、快速地识别题目考察的知识点，提高的准确程度，与人工进行标定相比，使用计算机标定可以大大节省时间和人力；可以避免人工标定中对同类型知识点有不同习惯称呼造成知识点混乱的问题等优点，用以解决上述背景技术中提出的问题。[0006]为实现上述目的，本发明提供如下技术方案：一种自动标定试题知识点的方法，包括如下步骤：

[0007]1.一种自动标定试题知识点的方法，其特征在于：包括如下步骤：[0008]S1、输入试题，首先需要准备好一定数量并且标定好了知识点的试题，然后将这些标定好知识点的试题输入到python程序中，且这些试题需要采用word文档格式进行保存，并且在python程序中会读取这些试题的word文档；[0009]S2、提取知识点，这些标定好知识点题目的word文档会被根据相应的检测格式识别出试题中的题干和对应的知识点，并且对题干和对应的知识点检测采用的神经网络由两

CN 111126051 A

说　明　书

2/4页

个卷积层检测进行，并且将题干和对应的知识点分别存储成csv格式的文件，再通过手动方式将csv文件格式转为xls文件格式，并且将文件文档中的逗号和句号替换为分隔符；[0010]S3、知识点矩阵和向量转化，然后读取处理后且标定好知识点题干的xls文件后，将题干中的每一行转化为一个正方形矩阵，并且当一行长度不能被开方时，用“0”补足，迭代此过程，直至能被开方；且每一个表示题干的正方形矩阵和一个知识点向量一一对应，和图像识别时中的图像标签对应一致；进而绘制成题干矩阵和知识点向量为训练材料；[0011]S4、保存模型，训练结果，最后使用神经网络的Relu激活函数进行训练，且Relu激活函数的表达式为F(x)＝max(0，X)，最终可以建立特征-标签，也就是一个给定的带有知识点标签的题目存在的特定字词和知识点之间对应关系的模型，在对题目预测选取的程序中载入上述建立的模型，然后就可以自动识别新题目的知识点。

[0012]所述步骤S1中将标定好知识点的题目使用word文件格式进行保存，并且通过python程序对word文件进行读取内容。

[0013]所述步骤S2中神经网络由两个卷积层，一个全连接层和一个输出层构成，在卷积层中，全连接层会将代表题干的正方形矩阵被分割为较小的正方形，程序将遍历每一个小正方形矩阵以发现各种特征的规律，输出层中包含题干是否包含某知识点的权值，将该值标准化，并约为0和1即可得到题目包含的知识点。

[0014]所述步骤S2中为了方便对文件的识别将csv文件格式转为xls文件格式，并且将文件中的逗号和句号进行用分隔符进行替换。

[0015]所述步骤S3中为了实现知识之间的向量关系，将题目的题干和知识点分别转化成知识矩阵，并且题干与知识点可以实现一对一的关系和一对多的关系。[0016]所述步骤S3中为了实现将题干转化成正方形矩阵，且对于不能够实现开方的题干长度，需要在题干的后方一“0”进行补充进行开方。

[0017]所述步骤S4中Relu函数是一个激活函数,能够克服梯度消失的问题，以及加快训练的速度，它的作用是如果计算出的值小于0，就让它等于0，否则保持原来的值不变，这样就简单粗暴地强制某些数据为0的方法，然而经实践证明，训练后的网络完全具备适度的稀疏性。

[0018]所述S4需要将题干知识点之间建立的向量模型输入到程序中，然后程序可以通过向量模型实现对大量题目进行题干和知识点的选取，实现对题目中知识点的确定，并且进行对题目的选取。

[0019]与现有技术相比，本发明的有益效果是：[0020]本发明采用机器学习的方式，使用卷积神经网络，只需要使用一定数量的标定完成的题目作为学习材料，经过训练后神经网络可以自动判断新题目考察了哪些知识点，以及可以准确、快速地识别题目考察的知识点，提高的准确程度；与人工进行标定相比，使用计算机标定可以大大节省时间和人力；可以避免人工标定中对同类型知识点有不同习惯称呼造成知识点混乱的问题。

附图说明

[0021]图1为本发明的方法流程示意框图；[0022]图2为本发明的Relu激活函数示意图。

CN 111126051 A

说　明　书

3/4页

具体实施方式

[0023]下面将结合本发明实例中的附图，对本发明实例中的技术方案进行清楚、完整地描述。所描述的实例仅仅是本发明的一部分实例，而不是全部的实例。基于本发明中的实例，本领域其他人员在没有做出创造性改变前提下所获得的所有其他实例，都属于本发明保护的范围。

[0024]请参阅图1-2，本发明提供一种技术方案：一种自动标定试题知识点的方法，包括如下步骤：

[0025]1.一种自动标定试题知识点的方法，其特征在于：包括如下步骤：[0026]S1、输入试题，首先需要准备好一定数量并且标定好了知识点的试题，然后将这些标定好知识点的试题输入到python程序中，且这些试题需要采用word文档格式进行保存，并且在python程序中会读取这些试题的word文档；[0027]S2、提取知识点，这些标定好知识点题目的word文档会被根据相应的检测格式识别出试题中的题干和对应的知识点，并且对题干和对应的知识点检测采用的神经网络由两个卷积层检测进行，并且将题干和对应的知识点分别存储成csv格式的文件，再通过手动方式将csv文件格式转为xls文件格式，并且将文件文档中的逗号和句号替换为分隔符；[0028]S3、知识点矩阵和向量转化，然后读取处理后且标定好知识点题干的xls文件后，将题干中的每一行转化为一个正方形矩阵，并且当一行长度不能被开方时，用“0”补足，迭代此过程，直至能被开方；且每一个表示题干的正方形矩阵和一个知识点向量一一对应，和图像识别时中的图像标签对应一致；进而绘制成题干矩阵和知识点向量为训练材料；[0029]S4、保存模型，训练结果，最后使用神经网络的Relu激活函数进行训练，且Relu激活函数的表达式为F(x)＝max(0，X)，最终可以建立特征-标签，也就是一个给定的带有知识点标签的题目存在的特定字词和知识点之间对应关系的模型，在对题目预测选取的程序中载入上述建立的模型，然后就可以自动识别新题目的知识点。

[0030]所述步骤S1中将标定好知识点的题目使用word文件格式进行保存，并且通过python程序对word文件进行读取内容，使用word文件格式可以使得python程序快速的检测题目，不需要对文件进行转格式或者是对图片内容进行提取，减少工作量，提高检测速度。[0031]所述步骤S2中神经网络由两个卷积层，一个全连接层和一个输出层构成，在卷积层中，全连接层会将代表题干的正方形矩阵被分割为较小的正方形，程序将遍历每一个小正方形矩阵以发现各种特征的规律，输出层中包含题干是否包含某知识点的权值，将该值标准化，并约为0和1即可得到题目包含的知识点，该处的两个卷积层的设定可以分别对题干和知识点进行提取，并且转化成正方形矩阵，然后输出权值且将权值转化成标准化。[0032]所述步骤S2中为了方便对文件的识别将csv文件格式转为xls文件格式，并且将文件中的逗号和句号进行用分隔符进行替换，通过手动的将csv文件格式转为xls文件格式可以方便对文件的提取，且逗号和句号使用分隔符替换可以使得软件的程序体能够识别分段。

[0033]所述步骤S3中为了实现知识之间的向量关系，将题目的题干和知识点分别转化成知识矩阵，并且题干与知识点可以实现一对一的关系和一对多的关系，该处的设定可以使得题干和知识点之间相互对应，且一个题干可以对应多个知识点。[0034]所述步骤S3中为了实现将题干转化成正方形矩阵，且对于不能够实现开方的题干

CN 111126051 A

说　明　书

4/4页

长度，需要在题干的后方一“0”进行补充进行开方，该处的补充可以使得题干能够形成正方形矩阵，方便度知识点之间的对应。

[0035]所述步骤S4中Relu函数是一个激活函数,能够克服梯度消失的问题，以及加快训练的速度，它的作用是如果计算出的值小于0，就让它等于0，否则保持原来的值不变，这样就简单粗暴地强制某些数据为0的方法，然而经实践证明，训练后的网络完全具备适度的稀疏性，该处的Relu函数可以快速的实现对计算建立特征-标签，也就是题干中的特定字词和知识点之间对应关系的模型。

[0036]所述S4需要将题干知识点之间建立的向量模型输入到程序中，然后程序可以通过向量模型实现对大量题目进行题干和知识点的选取，实现对题目中知识点的确定，并且进行对题目的选取，该处的程序可以通过向量模型进行知识题目进行选取。[0037]工作步骤：

[0038]在使用本方法时，首先需要准备好一定数量标定了知识点的试题，该试题采用word格式保存，使用python程序读取word文档，根据相应的格式识别出试题题干和对应的知识点，且用于识别题干和知识点的神经网络由两个卷积层、一个全连接层和一个输出层构成。在卷积层中，代表题干的正方形矩阵被分割为较小的正方形，程序将遍历每一个小正方形矩阵以发现各种特征的规律。输出层中包含题干是否包含某知识点的权值，将该值标准化，并约为0和1即可得到题目包含的知识点，并将二者分别存储成csv格式的文件，再手动将csv格式转为xls格式，并将逗号和句号替换为分隔符。读取处理后的题干，将题干中的每一行转化为一个正方形矩阵，当一行长度不能被开方时，用“0”补足，迭代此过程，直至能被开方。每一个表示题干的正方形矩阵和一个知识点向量一一对应，和图像识别时中图像-标签对应一致。利用上述过程得到的题干矩阵和知识点向量为训练材料，使用神经网络的Relu激活函数进行训练，最终可以建立特征-标签，也就是题干中的特定字词和知识点之间对应关系的模型。在预测程序中载入已建立的模型，即可识别新题目的知识点。[0039]尽管已经显示和描述了本发明的实例，对于本领域的其他技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

CN 111126051 A

说　明　书　附　图

1/1页

图1

图2

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文