回答:
GNU Scientific Libraryの 実装を見たことがありますか?ソースコードは十分に読みやすく、ルーチンは十分に文書化されています。
BLASの注目すべきC言語実装はATLASです。便利な機能の中で:
最高のパフォーマンス(Intel Xeon Phiの60コアのピークの85%以上)であるだけでなく、最も美しく書かれたものでもある高性能な実装については、BLISをご覧ください。
現在、大規模なオープンオンラインコース「LAFF-On High-Performance Computing」に取り組んでおり、dgemmを使用して、異なるレベルの並列化(命令レベル、OpenMP、MPI)を実現しています。
これはBLASのリファレンス実装ではありませんが、BLASのコーディング方法のリファレンスです(パフォーマンスのため)。最新情報を入手するには、www.ulaff.netにアクセスしてください。