我的书包

第156章 学术工ju人get

+A -A

维度爆炸。

    但是所收集到的数据通常会散布在一个极其分散广袤的高维空间中。

    这么做是为了除去噪音同时保存所关注信息的低维度数据。

    很多东西因为麻烦就足以让人说再见了。

    在实际进行处理时一般自然语言处理方向的研究人员一般都竭力避免出现高维爆炸的情况。

    就像欧拉公式一般。

    这就会陷入一个疯狂套娃的循环之中。

    将高维向量空

    如果林灰想表达的意思不是对高维数据做手脚。

    林灰的语气是那样的风轻云淡。

    而美好的事物所呈现的形式应该是简洁的。

    不过考虑到林灰先前为了米娜·卡莉做出的贴心之举。

    降维?将高维的什么进行降维??

    高维数据的低维处理某种程度更像是一种迫不得已的异常麻烦的补救措施。

    首先伊芙·卡莉觉得林灰想说的应该不是将高维数据降低成低维数据。

    而有的时候进行预处理时。

    在应用正式的降维技术之前。

    听了翻译同传过来的信息。

    话虽如此,但降维并不是像科幻书里描述的那般扔一个二向箔就完事了。

    极有可能使得原本离散的数据直接“糊”在一起。

    她有点想学中文了。

    在分析高维数据时,确实是可以进行降维的。

    伊芙·卡莉很想询问一下。

    出现这种情况后,应用场景经常会变得极其糟糕。

    最佳的预处理方式又是引入降维。

    降维这种方法经常用于数据压缩、数据探索以及数据可视化。

    在进行自然语言处理时如果出现了高维数据的话。

    机器学习领域中所谓的降维就是指采用某种映射方法。

    涉及到降维是一件极其麻烦的事情!

    伊芙·卡莉并不好就这种事情让林灰带来的翻译陷入到不安之中。

    对数据的性质和分辨率的考虑是十分重要的。

    在选择降维方法的时候,人们不得不考虑很多因素。

    繁复的过程意味着容易出错。

    如果不考虑输入数据的性质贸然进行降维的话虽然能够使得这些这些高维模型低维化。

    如果是省略了一些重要的名词那实在是太糟糕了。

    高维数据模型虽然收集到的数据点很多。

    原始的高维度数据通常包含了许多无关或冗余变量的观测值。

    事实上,现在维度爆炸问题已经很制约我们的研究了。

    这样对研究人员理解原本的高维数据所隐含的结构和模式很有帮助。

    (ps:……数学天赋点满的人高维也能硬上)

    彷佛在叙述一件自然而然的事情一般。

    仔细思索林灰话里的含意。

    将原高维空间中的数据点映射到低维度的空间中。

    总而言之,对高维数据进行降维是一件超级麻烦的事情。

    降维可以被看作是一种潜在特征提取的方法。

    还要对高维数据进行适当的预处理。

    也必须要进行降维!

    而不是等出现高维数据之后再进行低维处理。

    经常出现维度爆炸的问题。

    林灰道:“维度爆炸主要是高维难处理的问题。

    Dear林,不知道您关于这个问题有什么看法呢?”

    伊芙·卡莉有种要吐血的感觉。

    到底林灰想表达是将高维数据转化为低维数据?

    作为数据去噪简化的一种方法,降维处理对处理大多数现代机器学习数据很有帮助。

    她不知道林灰表达的原意就是将高维转化为低维。

    遇到这种维度灾难,不降维的话高维数据是很难进行处理的。

    这种情况下很多统计方法都难以应用到高维数据上。

    而是说对传统的向量空间模型做文章?

    毕竟不是所有的数据都是样本数据。

    抑或是什么其他含义?

    还是说将高维模型转化为低维模型?

    正因为如此,伊芙·卡莉觉得林灰这种天才想表达的意思绝对不是将高维数据降维成低维数据。

    比如说,对于连续数据、分类数据、计数数据、距离数据,它们会需要用到不同的降维方法。

    这也是“维度灾难”存在的原因之一。

    首先要考虑输入数据的性质。

    通过降低数据的维度,理论上讲可以把这个复杂棘手的问题变得简单轻松。

    这种情况比高维离散还要糟糕。

    还是说林灰在表述的时候说的是将高维的某物转化的低维但翻译在转达的时候却省略了什么东西。

    既然如此,为什么不考虑将高维进行降维呢?”


【1】【2】【3】【4】
如果您喜欢【我的书包】,请分享给身边的朋友
">