文章可以被理解为若干词语按照特定顺序和频率的组合,而词语就是这本字典的原子。传统的稀疏字典学习假设这种组合是线性的,也就是说X等于一个矩阵D乘以潜在编码Z,每个观测结果都是字典原子的加权叠加。 线性假设大大简化了数学处理,但代价是可能严重歪曲现实。拿神经网络的激活值来说,一个大型语言模型内部的表示经过
当前文章:http://1z0cp.zhanwangke.com/d3tzn/6o7c.xls
发布时间:20:23:24