Publications

Feng Chen, Yefei He, Lequan Lin, Jing Liu, Bohan Zhuang, Qi Wu (2025). Sparsity Forcing: Reinforcing Token Sparsity of MLLMs. ICLR 2026.

Feng Chen*, Yefei He*, Shaoxuan He*, Yuanyu He*, Jing Liu, Lequan Lin, Akide Liu, Zhaoyang Li, Jiyuan Zhang, Zhenbang Sun, Others (2025). OmniSparse: Training-Aware Fine-Grained Sparse Attention for Long-Video MLLMs. AAAI 2026.

Ruihang Chu*, Yefei He*, Zhekai Chen*, Shiwei Zhang, Xiaogang Xu, Bin Xia, Dingdong Wang, Hongwei Yi, Xihui Liu, Hengshuang Zhao, Others (2025). Wan-Move: Motion-controllable Video Generation via Latent Trajectory Guidance. NeurIPS 2025.

PDF Cite Code Project Video

Yefei He, Yuanyu He, Shaoxuan He, Feng Chen, Hong Zhou, Kaipeng Zhang, Bohan Zhuang (2025). Neighboring Autoregressive Modeling for Efficient Visual Generation. ICCV 2025.

PDF Cite Code Project Video

Yefei He, Feng Chen, Yuanyu He, Shaoxuan He, Hong Zhou, Kaipeng Zhang, Bohan Zhuang (2024). ZipAR: Accelerating Autoregressive Image Generation through Spatial Locality. ICML 2025.

PDF Cite Code Project

Yefei He, Feng Chen, Jing Liu, Wenqi Shao, Hong Zhou, Kaipeng Zhang, Bohan Zhuang (2024). ZipVL: Efficient Large Vision-Language Models with Dynamic Token Sparsification and KV Cache Compression. ICCV 2025.

PDF Cite Project

Yefei He, Luoming Zhang, Weijia Wu, Jing Liu, Hong Zhou, Bohan Zhuang (2024). ZipCache: Accurate and Efficient KV Cache Quantization with Salient Token Identification. NeurIPS 2024.

Akide Liu, Jing Liu, Zizheng Pan, Yefei He, Gholamreza Haffari, Bohan Zhuang (2024). MiniCache: KV Cache Compression in Depth Dimension for Large Language Models. NeurIPS 2024.

Yefei He, Jing Liu, Weijia Wu, Hong Zhou, Bohan Zhuang (2023). EfficientDM: Efficient Quantization-Aware Fine-Tuning of Low-Bit Diffusion Models. ICLR 2024 (spotlight).

Weijia Wu, Zhuang Li, Yefei He, Mike Zheng Shou, Chunhua Shen, Lele Cheng, Yan Li, Tingting Gao, Di Zhang, Zhongyuan Wang (2023). Paragraph-to-image generation with information-enriched diffusion model. arXiv preprint arXiv:2311.14284.