awesome-repositories.comBlog

© 2026 Bringes Technology SRL·VAT RO45896025·hello@awesome-repositories.com

MCP Blog Curated searches Sitemap Privacy Terms

CLUECorpus2020 | Awesome Repository

CLUEbenchmarkCLUECorpus2020

0

View on GitHub↗

1,012 stars·83 forks·MIT·0 viewsarxiv.org/abs/2003.01355↗

CLUECorpus2020

Features

Datasets and Corpora - High-quality Chinese pre-training corpus for NLP tasks.
Pre-training Datasets - Cleaned 100GB Chinese corpus for pre-training and NLP tasks.

AI search

Explore more awesome repositories

Describe what you need in plain English — the AI ranks thousands of curated open-source projects by relevance.

Start searching with AI

Large-scale Pre-training Corpus for Chinese 100G 中文预训练语料