RTX4090 メモリ転送をもう少し深堀してみる。
タグ: fp64
CPU, GPU の FP32, FP64 性能の検証
格子数を変えて CPU, GPU 性能を検証してみる。
PyTorch の fp32, fp64 性能の謎
二次元 cavity 問題を fp32, fp64 で解いても計算時間が変わらない??
意外に遅い? RTX4090 の fp64 性能
RTX4090 の fp64 性能の計測結果。意外に遅い。
RTX4090 メモリ転送をもう少し深堀してみる。
格子数を変えて CPU, GPU 性能を検証してみる。
二次元 cavity 問題を fp32, fp64 で解いても計算時間が変わらない??
RTX4090 の fp64 性能の計測結果。意外に遅い。