毕昇编译器异构算子分核方案再探
摘要根据vec_cross_add
接口的正确用法重新实现了前面的动态分核方案,效果进一步提升。
先说结论,问题出在我粗心了,磕头道歉!!本接口没有计算逻辑性问题,为上篇中不严谨的言论道歉。但在特定情况下,会有不符合预期的返回值。
西瓜书第2章学习笔记,别问为什么没有第1章,问就是懒。。。看的我数学恐惧症都要犯了,但还是能感受到数学的魅力;西瓜书本章从学习器的性能评估方法、性能度量、比较检验等方面描述了如何评估和选择学习算法
Pytorch中常用的数学函数,包括三角函数、绝对值函数、sign()
函数、误差函数等;还有一些统计学相关函数,包括histc()
函数、bincount()
函数等。
关于Pytorch中Tensor的一系列基本运算及矩阵运算,同时介绍一下in-place操作和Tensor的广播机制;还提到了一些其他运算,如取整、取余、比较、排序等;最后介绍Tensor数据合法性校验的方法。
介绍Pytorch中Tensor的属性以及稀疏张量的概念,还有一个小概念——COO风格矩阵。