2016年3月19日 星期六

閱讀筆記:GPU的指令運算細節

最近看到了一篇 Nervana 發表的文章
他們宣稱可以讓 CUDA 矩陣乘法運算速度在 Maxwell 上達到理論上限的 90% 以上
裡面除了用到 register blocking(從別的 paper 借來用的技巧)
也講解了很多一般不太可能知道的 NVIDIA GPU 運作細節
讓人不禁懷疑作者是不是從 NVIDIA 的相關部門拿到資料
知道這些細節之後,就可能產生出高效率的矩陣乘法 CUDA kernel

2016年3月14日 星期一

東京四日行(二)

從日本回來已經快一個月了
繼續把剩下的東西補齊
這邊紀錄一下有去的景點
基本上都是東京市區搭地鐵好到的