因此可以通过考虑两个数据集在线性变换下的信息损失来度量两个数据集的差异(相似度)。具体的,可以考虑求解以下优化问题:优化过程也是使两个数据集在样本层面和特征层面对齐的过程,求解优化问题得到的结果可以作为两个数据集的差异度量。如何衡量两个“任意数据集”间的相似度?对于两个数据集和。若存在矩阵和,使得,可以通过经过若干次线性变换得到,这表明了中的信息完全蕴含在中。此时,相对于,中的信息是冗余的。这种冗余既可以体现在维度上,即中的样本分布在一个高维空间中的低维流形上,也可以体现在样本上,即中存在一些非常相似的样...
更新时间:2022-04-09标签: 差异性度量事物之间事物之间差异性的度量怎么度量差异性 全文阅读