@@ -40,7 +40,9 @@ MovieLens数据集评分回归模型
4040
4141ml-1m的字段配置文件在目录 :code: `demo/recommendation/data/config.json ` 中。
4242其具体说明了字段类型和文件名称:
43+
43441) 用户文件中有四种类型的字段\: 编号,性别,年龄和职业;
45+
44462) 文件名称为"users.dat",文件的分隔符为"::"。
4547
4648.. include :: ../../../demo/recommendation/data/config.json
@@ -96,22 +98,22 @@ Meta配置文件
9698
9799* 在电影文件movies.dat中
98100 * 我们仅用"::"来分隔每一行
99- * pos 0 代表编号。
101+ * pos 0 代表编号
100102 * pos 1 特征:
101- * name是电影名。
102- * 利用正则表达式来解析该特征。
103- * 基于字母的词嵌入特征。
104- * 是序列。
103+ * name是电影名
104+ * 利用正则表达式来解析该特征
105+ * 基于字母的词嵌入特征
106+ * 是序列
105107 * pos 2 特征:
106- * name是体裁。
107- * type是one hot稠密向量。
108- * dictionary由解析自动生成,每一个key由'|'分隔。
108+ * name是体裁
109+ * type是one hot稠密向量
110+ * dictionary由解析自动生成,每一个key由'|'分隔
109111* 在用户文件users.dat中
110112 * 我们仅用"::"来分隔每一行
111- * pos 0 代表编号。
113+ * pos 0 代表编号
112114 * pos 1 特征:
113- * name是性别。
114- * 简单的基于字母的词嵌入。
115+ * name是性别
116+ * 简单的基于字母的词嵌入
115117 * pos 2 特征:
116118 * name是年龄
117119 * 是整个的词嵌入
@@ -135,7 +137,7 @@ meta文件 :code:`meta.bin` 的结构如下:
135137
136138.. code-block :: text
137139
138- +--+ movie
140+ +--+ movie
139141 | +--+ __meta__
140142 | | +--+ raw_meta # 每个特征的meta配置。列表
141143 | | | +
@@ -229,7 +231,7 @@ meta文件 :code:`meta.bin` 的结构如下:
229231* :code: `id ` \: 仅仅是简单的嵌入,然后添加一个全连接层。
230232* :code: `embedding ` \:
231233 - 如果是序列,则先做嵌入,然后再做一次文本卷积网络操作,
232- 然后得到平均采样的结果
234+ 然后得到平均采样的结果。
233235 - 如果不是序列,则先做嵌入,然后添加一个全连接层。
234236* :code: `one_host_dense ` \:
235237 - 仅仅是两个全连接层。
@@ -246,7 +248,7 @@ meta文件 :code:`meta.bin` 的结构如下:
246248* 采样层, :ref: `api_trainer_config_helpers_layers_pooling_layer `
247249* 余弦相似度层, :ref: `api_trainer_config_helpers_layers_cos_sim `
248250* 文本卷积采样层, :ref: `api_trainer_config_helpers_network_text_conv_pool `
249- * 声明Python数据源, :ref: `api_trainer_config_helpers_data_sources ` .
251+ * 声明Python数据源, :ref: `api_trainer_config_helpers_data_sources `
250252
251253数据提供脚本
252254'''''''''''
@@ -260,9 +262,9 @@ meta文件 :code:`meta.bin` 的结构如下:
260262
261263* obj.slots\: 特征的类型和维度。
262264* use_seq\: :code: `dataprovider.py ` 中的数据是否为序列模式。
263- * process\: 返回数据的每一条样本给 :code: `paddle ` .
265+ * process\: 返回数据的每一条样本给 :code: `paddle ` 。
264266
265- 数据提供脚本的细节文档可以参考 :ref: `api_pydataprovider ` .
267+ 数据提供脚本的细节文档可以参考 :ref: `api_pydataprovider ` 。
266268
267269训练
268270````
@@ -287,9 +289,9 @@ meta文件 :code:`meta.bin` 的结构如下:
287289* trainer_count\: 一台机器上面的线程数量。
288290* test_all_data_in_one_period\: 每一个测试周期测试一次所有数据。否则,
289291 每个测试周期测试: code:`batch_size ` 批次的数据。
290- * log_period\: 在训练了: code:`log_period ` 批次后打印日志.
291- * dot_period\: 在每训练: code:`dot_period ` 个批次后打印一个 :code: `. ` .
292- * num_passes\: 训练至多: code:`num_passes ` 轮.
292+ * log_period\: 在训练了: code:`log_period ` 批次后打印日志。
293+ * dot_period\: 在每训练: code:`dot_period ` 个批次后打印一个 :code: `. ` 。
294+ * num_passes\: 训练至多: code:`num_passes ` 轮。
293295
294296如果训练过程启动成功的话,输出应该类似如下:
295297
0 commit comments