2023-10-16 22e90cba851ddda1a6dc1c7f1bc13559 99+ 16 分钟 2.4 k毕昇编译器异构算子分核方案再探摘要根据vec_cross_add接口的正确用法重新实现了前面的动态分核方案,效果进一步提升。 高性能计算 项目 毕昇编译器 机器学习 异构编程 深度学习阅读更多>> 最后修改: 2024-06-19
2023-08-17 796f3e8359ca803fcec89444c953bea7 99+ 16 分钟 2.4 k关于vec_cross_add接口的详细测试先说结论,问题出在我粗心了,磕头道歉!!本接口没有计算逻辑性问题,为上篇中不严谨的言论道歉。但在特定情况下,会有不符合预期的返回值。 高性能计算 项目 毕昇编译器 机器学习 异构编程 深度学习阅读更多>> 最后修改: 2024-06-19
2023-07-31 e73b573c2dd1266b559e5e4baa434375 99+ 1 小时 8.5 k基于毕昇编译器的softmax异构算子使用毕昇编译器异构开发Softmax算子,坑太多太多了。。。。 高性能计算 项目 毕昇编译器 机器学习 异构编程 深度学习阅读更多>> 最后修改: 2024-06-19