欢迎光临,我们是一家专注中小型企业营销推广服务的公司!

咨询热线:400 9868 577
淮南兰乔电子商务有限公司
新闻中心News
淮南兰乔电子商务有限公司

谷歌发布开源工具Magika 1.0,核心引擎重写以提升性能

作者:P粉602998670 | 点击: | 来源:P粉602998670
0711
2025
当地时间周四,谷歌正式宣布,推出其基于人工智能的文件类型检测系统——Magika的1.0稳定版本。此次更新最大的亮点在于,其核心引擎已完全采用Rust语言进行重写,以实现更高的性能和内存安全性。据谷歌介绍,自去年初首次开源以来,Magika已在开源社区获得了广泛的应用,其月度下载量已超过100万次。...

当地时间周四,谷歌正式宣布,推出其基于人工智能的文件类型检测系统——magika的1.0稳定版本。此次更新最大的亮点在于,其核心引擎已完全采用rust语言进行重写,以实现更高的性能和内存安全性。

据谷歌介绍,自去年初首次开源以来,Magika已在开源社区获得了广泛的应用,其月度下载量已超过100万次。

性能飞跃与更广泛的文件支持

得益于Rust语言的重构,新版的Magika在性能上实现了巨大的飞跃。其新提供的原生Rust命令行工具,在单核环境下,每秒可识别数百个文件;而在多核CPU上,这一数字更可扩展至每秒数千个。根据谷歌公布的测试数据,在一台MacBook Pro (M4)上,Magika每秒可处理约1000个文件。

在文件类型的支持方面,Magika 1.0的检测能力已扩展至超过200种文件格式,是初始版本的两倍。此次新增的类别,涵盖了数据科学(如Jupyter Notebooks)、现代编程与网页开发(如Swift, Kotlin, TypeScript)、DevOps与配置文件(如Dockerfile, TOML)以及数据库与图形格式(如SQLite, Ph

otoshop)等多个前沿领域。

此外,新版本还显著提升了其区分相似格式的能力,例如,它现在可以准确地区分JSONL与JSON、C与C++、JavaScript与TypeScript等容易混淆的文件类型。

技术挑战与未来展望

在技术实现上,该团队主要克服了两大挑战:一是如何高效地处理超过3TB的庞大训练数据集;二是如何应对部分文件类型样本稀缺的问题。对于前者,谷歌采用了自研的数据集库;而对于后者,研究团队则创造性地使用了生成式AI工具Gemini,来创建高质量的合成训练数据,以增强模型的泛化能力。

谷歌表示,Magika的未来发展,将持续聚焦于性能的优化和文件类型的扩展,并鼓励广大的开发者社区,能够积极参与到该项目的贡献中来。

相关推荐
我要咨询做网站
成功案例
建站流程
  • 网站需
    求分析
  • 网站策
    划方案
  • 页面风
    格设计
  • 程序设
    计研发
  • 资料录
    入优化
  • 确认交
    付使用
  • 后续跟
    踪服务
  • 400 9868 577
    info#ilanqiao.cn
Hi,Are you ready?
准备好开始了吗?
那就与我们取得联系吧

咨询送礼现在提交,将获得兰乔电子商务策划专家免费为您制作
价值5880元《全网营销方案+优化视频教程》一份!
下单送礼感恩七周年,新老用户下单即送创业型空间+域名等大礼
24小时免费咨询热线400 9868 577
合作意向表
您需要的服务
您最关注的地方
预算

直接咨询