neural-network 神经网络的典型工作流程
示例
无论使用什么库,训练和使用神经网络的典型工作流程如下:
训练数据
获取训练数据:X变量是输入,Y变量是输出。最简单的操作是学习一个逻辑门,其中X一个是一个或两个数字,Y一个是一个数字的向量。通常,输入和输出值是浮点数,因此,如果它是单词,则可以将每个单词关联到不同的神经元。您也可以直接使用字符,然后使用的神经元少于保存整个词典的时间。
建筑
定义神经网络的体系结构:这是通过指定神经元如何链接在一起以及使用哪种算法来训练和更改神经元之间的连接来完成的。例如,使用递归神经网络完成文本处理,递归神经网络在每个时间步都接收到一个新的输入,并且为了有效的计算目的,神经元会及时引用其早期值。通常,使用神经元层,它们通常从输入到输出一层一层地堆叠。神经元从一层到另一层的连接方式变化很大。一些计算机视觉架构使用深度神经网络(具有许多专门的层堆叠)。
评价
接下来,通常根据尚未直接训练的数据评估神经网络。这包括将X部分数据呈现给神经网络,然后将Y其预测结果与实数进行比较Y。存在许多评估学习质量的指标。
改善
再次摆弄神经网络的体系结构以提高其性能是很常见的。由于这两种情况都会产生问题,因此神经网络必须不太智能且不会太笨。在第一种情况下,神经网络对于数据而言可能太大,无法完美存储,并且可能无法推广到新的未见示例。在第二种情况下,如果神经网络太笨(小),它也将无法学习。
实际使用
在新数据上使用它来预测输出。实际上,神经网络非常有用,自动文本翻译或对文本问题的响应就是很好的例子。在线学习是现阶段用来改进神经网络的一种技术,这意味着如果网络可以得到有关其输出的建设性反馈,则仍然有可能继续学习过程。例如,GoogleTranslate可能会要求用户提供有关翻译的反馈。