王文盈, 李文娟, 陈飞
聚合降维 (Wang等, 2020; Wang和Yin, 2021)是一族重要的充分降维方法, 在应对复杂模型方面颇具优势. 该方法在每个样本点的$k$邻域上进行降维, 再将各局域上的降维结果聚合. 文章试图调整局域内的数据分布,使其接近椭圆分布, 从而改善其上的局部降维效果, 以提高最终的聚合逆均值估计的精度. 然而,由于各局域内样本量不能取得太大, 现有的基于Voronoi权重的重加权方法 (Cook和Nachtsheim, 1994)会面临两个问题:一是,难以构建与数据适配良好的目标分布; 二是, 样本点的权重求取也变得困难. 为此, 文章提出了自适应重加权方法, 以解决上述问题. 该方法依托局域内的一个初始充分降维的结果来获得其中的数据点权重. 文章导出了几个性质, 揭示初始充分降维方向与自变量向量投影不满足线性设计条件的子空间之间的关系, 以说明该方法的合理性. 通过模拟和真实数据分析, 该方法的效果得到了验证.