使ったのはこんなavs
vsource="test.d2v"
ref=DGDecode_MPEG2Source(vsource,idct=5).trim(1,5000)
target=MPEG2DecPlus_MPEG2Source(vsource,idct=4).trim(1,5000)
compare(ref,target,"","hoge5-4.log")
return last
参考:昔調べたDGMpegdecの各精度
DGDecodeのidct=5をリファレンスに取ったMPEG2DecPlusのPSNR[dB]
idct | Minimum | Average | Maximum | Overall |
1,2,3,6,7: AP922整数 | 59.3174 | 63.8421 | 81.0069 | 63.2977 |
4: SSE2/AVX2 LLM | 92.9447 | 101.995 | 111.8096 | 100.4447 |
5: IEEE 1180 reference | 100.3483 | 111.1362 | 111.8096 | 110.6078 |
BSのアニメ(1920x1080)をデコードしたときの速度
idct | DGDecodeSSE | MPEG2DecPlus |
3 | 284.398fps | 255.885fps |
4 | 187.730fps | 225.459fps |
5 | 138.206fps | 102.459fps |
というわけで、idct=4を使うならMPEG2DecPlusの方が速そうです。
追伸
sandybridge(i7-2600K)ではMPEG2DecPlus_MPEG2Source(idct=4)を使うと遅い・・・
haswellでは速い、ということはAVX2とかで最適化されているのかな?
→「アセンブラの排除による64bitへの対応、及びSSE2/AVX2でのintrinsicによる最適化。等」と書いてあったので、そうなのでしょう
0 件のコメント:
コメントを投稿