Skip to content

Commit 2fbcf4d

Browse files
committed
small details
1 parent bd5b101 commit 2fbcf4d

File tree

1 file changed

+21
-19
lines changed

1 file changed

+21
-19
lines changed

doc/tutorials/rec/ml_regression_ch.rst

Lines changed: 21 additions & 19 deletions
Original file line numberDiff line numberDiff line change
@@ -40,7 +40,9 @@ MovieLens数据集评分回归模型
4040

4141
ml-1m的字段配置文件在目录 :code:`demo/recommendation/data/config.json` 中。
4242
其具体说明了字段类型和文件名称:
43+
4344
1) 用户文件中有四种类型的字段\: 编号,性别,年龄和职业;
45+
4446
2) 文件名称为"users.dat",文件的分隔符为"::"。
4547

4648
.. include:: ../../../demo/recommendation/data/config.json
@@ -96,22 +98,22 @@ Meta配置文件
9698

9799
* 在电影文件movies.dat中
98100
* 我们仅用"::"来分隔每一行
99-
* pos 0 代表编号
101+
* pos 0 代表编号
100102
* pos 1 特征:
101-
* name是电影名
102-
* 利用正则表达式来解析该特征
103-
* 基于字母的词嵌入特征
104-
* 是序列
103+
* name是电影名
104+
* 利用正则表达式来解析该特征
105+
* 基于字母的词嵌入特征
106+
* 是序列
105107
* pos 2 特征:
106-
* name是体裁
107-
* type是one hot稠密向量
108-
* dictionary由解析自动生成,每一个key由'|'分隔
108+
* name是体裁
109+
* type是one hot稠密向量
110+
* dictionary由解析自动生成,每一个key由'|'分隔
109111
* 在用户文件users.dat中
110112
* 我们仅用"::"来分隔每一行
111-
* pos 0 代表编号
113+
* pos 0 代表编号
112114
* pos 1 特征:
113-
* name是性别
114-
* 简单的基于字母的词嵌入
115+
* name是性别
116+
* 简单的基于字母的词嵌入
115117
* pos 2 特征:
116118
* name是年龄
117119
* 是整个的词嵌入
@@ -135,7 +137,7 @@ meta文件 :code:`meta.bin` 的结构如下:
135137

136138
.. code-block:: text
137139
138-
+--+ movie
140+
+--+ movie
139141
| +--+ __meta__
140142
| | +--+ raw_meta # 每个特征的meta配置。列表
141143
| | | +
@@ -229,7 +231,7 @@ meta文件 :code:`meta.bin` 的结构如下:
229231
* :code:`id` \: 仅仅是简单的嵌入,然后添加一个全连接层。
230232
* :code:`embedding` \:
231233
- 如果是序列,则先做嵌入,然后再做一次文本卷积网络操作,
232-
然后得到平均采样的结果
234+
然后得到平均采样的结果
233235
- 如果不是序列,则先做嵌入,然后添加一个全连接层。
234236
* :code:`one_host_dense` \:
235237
- 仅仅是两个全连接层。
@@ -246,7 +248,7 @@ meta文件 :code:`meta.bin` 的结构如下:
246248
* 采样层, :ref:`api_trainer_config_helpers_layers_pooling_layer`
247249
* 余弦相似度层, :ref:`api_trainer_config_helpers_layers_cos_sim`
248250
* 文本卷积采样层, :ref:`api_trainer_config_helpers_network_text_conv_pool`
249-
* 声明Python数据源, :ref:`api_trainer_config_helpers_data_sources` .
251+
* 声明Python数据源, :ref:`api_trainer_config_helpers_data_sources`
250252

251253
数据提供脚本
252254
'''''''''''
@@ -260,9 +262,9 @@ meta文件 :code:`meta.bin` 的结构如下:
260262

261263
* obj.slots\: 特征的类型和维度。
262264
* use_seq\: :code:`dataprovider.py` 中的数据是否为序列模式。
263-
* process\: 返回数据的每一条样本给 :code:`paddle` .
265+
* process\: 返回数据的每一条样本给 :code:`paddle`
264266

265-
数据提供脚本的细节文档可以参考 :ref:`api_pydataprovider` .
267+
数据提供脚本的细节文档可以参考 :ref:`api_pydataprovider`
266268

267269
训练
268270
````
@@ -287,9 +289,9 @@ meta文件 :code:`meta.bin` 的结构如下:
287289
* trainer_count\: 一台机器上面的线程数量。
288290
* test_all_data_in_one_period\: 每一个测试周期测试一次所有数据。否则,
289291
每个测试周期测试: code:`batch_size` 批次的数据。
290-
* log_period\: 在训练了: code:`log_period` 批次后打印日志.
291-
* dot_period\: 在每训练: code:`dot_period` 个批次后打印一个 :code:`.` .
292-
* num_passes\: 训练至多: code:`num_passes` 轮.
292+
* log_period\: 在训练了: code:`log_period` 批次后打印日志
293+
* dot_period\: 在每训练: code:`dot_period` 个批次后打印一个 :code:`.`
294+
* num_passes\: 训练至多: code:`num_passes` 轮
293295

294296
如果训练过程启动成功的话,输出应该类似如下:
295297

0 commit comments

Comments
 (0)