投稿者ははるはゆるさん(ってか銀銀さん?)ともんじゅさん。
今年も終わりですね。
Rococoworksは2011年12月末日をもって解散することといたしました。
ゲームも遊べる強力なGPUを備えた安いCPUという独自色
メーカー | 型式 | 定価 | コンポ(シフター) | フレーム | ブレーキ | メモ |
Giant | TCX1 | 180k+tax | Rival | 6013アルミ | AVID SHORTY 6 | ダボ穴なし カーボンフォーク? |
Giant | TCX2 | 100k+tax | Sora | 6013アルミ | AVID SHORTY 4 | ダボ穴付き アルミフォーク 買うならコンポ交換かな? |
GARNEAU | LGS-CX | 135k+tax | 105 | 6066アルミ | TRP EUROX | ダボ穴あり?カーボンフォーク ハブも105 スプロケはTiagra |
TREK | Ion CX | 170k | Apex | 6000アルミ? | AVID SHORTY 4 | ダボ穴取り付け可 FD用ケーブルがフレーム下配線 |
FELT | F65X | 165k+tax | Apex | 7005アルミ | Avid BB5 | ダボ穴あり?カーボンフォーク RDがRival、スプロケはOG型番で古い? 変速ケーブルがフレーム下配線 |
TREK | XO1(2011) | 179k | Apex | 6000系アルミ | Avid SHORTY4 | 9.2kg ダボ穴取り付け可 カーボンフォーク FDケーブルがフレーム下 |
開始日時 | 2011/11/27 08:47:35 | 終了日時 | 2011/11/27 16:31:47 |
水平距離 | 166.39km | 沿面距離 | 166.46km |
経過時間 | 7時間44分12秒 | 移動時間 | 6時間43分25秒 |
全体平均速度 | 21.5km/h | 移動平均速度 | 24.8km/h |
最高速度 | 58.0km/h | 昇降量合計 | 1183m |
総上昇量 | 604m | 総下降量 | 579m |
最高高度 | 61m | 最低高度 | -35m |
現在のアニメのほとんどはオタクの消費財
24~27%向上ということですが、自分の環境ではどの程度?ということで以前と同じようなことをやってみました。
前と同じように
vsource="D:\hoge.d2v"
PluginDir="dokoka\avisynth\plugins\"
LoadPlugin(PluginDir+"DGDecode.dll")
DGDecode_MPEG2Source(vsource,idct=1~7).trim(5000,9999)
return last
ってなスクリプトを作ってavs2pipemod -benchを使ってX3350@3.2Gとi7-2600K@4.5Gで速度を調査しました。
ソースは地上波のアニメ(1440x1080)です。
Xeon X3350(≒C2Q9450)@3.2GHz+DDR2 800MHz 6GBでの結果
idct=1 (32-bit MMX) | idct=2 (32-bit SSEMMX) | idct=3 (32-bit SSE2MMX) | idct=4 (64-bit Floating Point) | idct=5 (64-bit IEEE-1180 Reference) | idct=6 (32-bit SSEMMX (Skal)) | idct=7 (32-bit Simple MMX (XviD)) | |
DGDecode1.5.8 | 116fps | 124fps | 137fps | 108fps | 81fps | 133fps | 127fps |
DGDecode1.5.8_SSE | 130fps | 139fps | 157fps | 121fps | 89fps | 154fps | 144fps |
速度比率 | 113% | 113% | 115% | 112% | 110% | 116% | 113% |
i7-2600K@4.5GHz+DDR3 1600MHz 8GBでの結果
idct=1 (32-bit MMX) | idct=2 (32-bit SSEMMX) | idct=3 (32-bit SSE2MMX) | idct=4 (64-bit Floating Point) | idct=5 (64-bit IEEE-1180 Reference) | idct=6 (32-bit SSEMMX (Skal)) | idct=7 (32-bit Simple MMX (XviD)) | |
DGDecode1.5.8 | 194fps | 202fps | 241fps | 192fps | 150fps | 234fps | 212fps |
DGDecode1.5.8_SSE | 222fps | 234fps | 277fps | 215fps | 165fps | 279fps | 243fps |
速度比率 | 115% | 116% | 115% | 112% | 110% | 119% | 115% |
10~19%速度が向上しています。
コンパイラの最適化すげぇ。
まぁ、その分危険性もはらんでいますが・・・。
PhenomII X3 720BE(定格=2.8GHz 3Core) + DDR2 800MHz 8GBでの結果
idct=1 (32-bit MMX) | idct=2 (32-bit SSEMMX) | idct=3 (32-bit SSE2MMX) | idct=4 (64-bit Floating Point) | idct=5 (64-bit IEEE-1180 Reference) | idct=6 (32-bit SSEMMX (Skal)) | idct=7 (32-bit Simple MMX (XviD)) | |
DGDecode1.5.8 | 86fps | 89fps | 101fps | 72fps | 69fps | 104fps | 96fps |
DGDecode1.5.8_SSE | 94fps | 98fps | 112fps | 78fps | 75fps | 117fps | 105fps |
速度比率 | 109% | 110% | 111% | 108% | 108% | 112% | 110% |
PhenomIIでは大体10%UPぐらいでしょうか。
次に↓のようなスクリプトでリファレンスを1.5.8オリジナルのidct=5(IEEE-1180 Reference)に取って各idct時のPSNR(dB)を求めてみました。
LoadPlugin(PluginDir+"DGDecode.dll")
LoadPlugin(PluginDir+"DGDecode_old.dll")
ref=DGDecode_old_MPEG2Source(vsource,idct=5).trim(5000,9999)
target=DGDecode_MPEG2Source(vsource,idct=1).trim(5000,9999)compare(ref,target,"","1.log")
return last
結果は
idct=1 (32-bit MMX) | idct=2 (32-bit SSEMMX) | idct=3 (32-bit SSE2MMX) | idct=4 (64-bit Floating Point) | idct=5 (64-bit IEEE-1180 Reference) | idct=6 (32-bit SSEMMX (Skal)) | idct=7 (32-bit Simple MMX (XviD)) | |
PSNR Minimum | 60.7201 | 60.7201 | 60.7201 | 94.1753 | 111.8096 | 61.6186 | 65.8953 |
PSNR Average | 65.7081 | 65.7081 | 65.7081 | 107.8469 | 111.8096 | 65.8824 | 70.4569 |
PSNR Maximum | 81.4593 | 81.4593 | 81.4593 | 111.8096 | 111.8096 | 81.4995 | 89.4543 |
となり、これは以前と同じような傾向ですね。
リファレンスからの差は
ref=5>4>>7>6≒1=2=3
な感じで、速度と精度の兼ね合いで好きなのを選べばって所で。
最後に念のため1.5.8オリジナルとSSE最適化版で同じidctでの違いを調査。
idct=1 (32-bit MMX) | idct=2 (32-bit SSEMMX) | idct=3 (32-bit SSE2MMX) | idct=4 (64-bit Floating Point) | idct=5 (64-bit IEEE-1180 Reference) | idct=6 (32-bit SSEMMX (Skal)) | idct=7 (32-bit Simple MMX (XviD)) | |
PSNR Minimum | 111.8096 | 111.8096 | 111.8096 | 94.9972 | 111.8096 | 111.8096 | 111.8096 |
PSNR Average | 111.8096 | 111.8096 | 111.8096 | 108.3973 | 111.8096 | 111.8096 | 111.8096 |
PSNR Maximum | 111.8096 | 111.8096 | 111.8096 | 111.8096 | 111.8096 | 111.8096 | 111.8096 |
•VOB, MPG: Seeking seems to be off by one or two frames now and thenとのことで、1フレームずれると大変なことになったりするような編集には向かなさそうです(?)
•M2TS, TS: Seeking seems to be off a few frames here and there
PINUPS - 上田新聞 blog版: SocketAM3+で動作するBulldozerアーキテクチャでTDP 65W/45WのOpteron 3280 HE/3260 EE/3250 EEの価格
・・・鯖だからopteronでもいいかな?AM3+で動き65w,45w程度であるならば・・・。
という妄想。
いや、久しぶりのFXシリーズがこけなければこんなことに悩む必要はなかったのですが。
マシンに4倍のコストをかけた結果、3年前に比べて約10%の速度向上を果たしました。
・・・とりあえず目標だった10分切りも(最終週のみ)達成出来たので良かったのですが、それなりに準備をしてこの程度か、という気もします。
後やるとすれば
・23Cにする(現状25C)
・ペース配分を考える(最終週が最速ってのは微妙な気がする)
・スタミナをつける
ぐらいしか残っていなさそうな。
さらに10%速度を上げるにはそれなりの苦労が必要そうです。
世界人口は31日に70億人に達した。国連はこの日に生まれたすべての子どもを「70億人目の赤ちゃんたち」としている。
2011年9月2日(金)に発売となります『未来ノスタルジア』につきまして、
予想を上回るご好評をいただき、メーカー在庫が無くなりましたのでご報告いたします。
この為、発売日以降、各販売店様の店頭在庫が無くなり次第本商品は完売となります。
ご購入をお考えのお客様はお早目にお求めいただけますよう、よろしくお願い申し上げます。
set filesize=%~z1
set /a halfsize=filesize
echo filesize:%filesize%
echo halfsize:%halfsize%
1.↓みたいなavsでTFMとTDecimateの情報を出力
MPEG2Source(vsource,idct=4)
TFM(mode=1,order=-1,output="TFMout.txt")
TDecimate(mode=4,output="TDmetrics.txt")
return last
2.EasyVFR用の設定ファイルを出力
perl TDFManalyze.pl TFMout.txt TDmetrics.txt TDFMconf > output.txt
3.こっから先は好きな様にしてください
とりあえずEVFR2でtimecode出力
import(PluginDir+"EasyVFR_ver2.avs")
MPEG2Source(vsource,idct=4)
timecode="timecodev1.tmc"
import("output.txt")
trim(0,-1)
return last
function VFR24(clip clip){
clip
TFM(mode=1,order=-1,PP=7).TDecimate(mode=1)
return last
}
function VFR60(clip clip){
clip
temp1=last
interp=temp1.NNEDI3(field=-2,nns=1,nsize=4)
temp1.Tdeint(mode=1,type=3,mthreshL=8,mthreshC=8,edeint=interp,AP=64,APtype=1)
return last
}
function VFR30(clip clip){
clip
TFM(mode=1,order=-1)
return last
}
4.trim(0,-1)とtimecode="timecodev1.tmc"のところを変えたスクリプトを作り、
x264でtmcを指定してエンコード
x264 --tcfile-in "timecodev1.tmc" --timebase 1001/120000 encode.avs -o output.mp4
P8P67 DELUXE 1703 BIOS
Improve DRAM compatibility.
time[s] fps Total, 47.097303 122.0452 - 1: 32-bit MMX Total, 44.569595 128.9668 - 2: 32-bit SSEMMX Total, 39.992818 143.7258 - 3: 32-bit SSE2MMX Total, 54.603527 105.2679 - 4: 64-bit Floating Point Total, 119.720955 48.0116 - 5: 64-bit IEEE-1180 Reference Total, 40.995461 140.2106 - 6: 32-bit SSEMMX (Skal) Total, 45.682227 125.8257 - 7: 32-bit Simple MMX (XviD)
Minimum Average Maximum PSNR: 57.2801 66.2722 105.7890 Overall PSNR: 64.8699 - 1: 32-bit MMX PSNR: 57.2801 66.2722 105.7890 Overall PSNR: 64.8699 - 2: 32-bit SSEMMX PSNR: 57.2801 66.2722 105.7890 Overall PSNR: 64.8699 - 3: 32-bit SSE2MMX PSNR: 101.0178 111.6039 111.8096 Overall PSNR: 111.3280 - 4: 64-bit Floating Point PSNR: 57.0100 66.0122 101.8096 Overall PSNR: 64.4922 - 6: 32-bit SSEMMX (Skal) PSNR: 64.8524 70.5898 104.8199 Overall PSNR: 69.6416 - 7: 32-bit Simple MMX (XviD)
time[s] fps Total, 141.1712 40.7165 m2v.vfp(浮動小数点) Total, 61.1951 93.9290 m2v.vfp(整数 32bit LLM) Total, 54.6766 105.1273 m2v.vfp(整数 32bit AP-922)
194.465fps -1 208.223fps -2 250.210fps -3 183.132fps -4 135.801fps -5 241.795fps -6 215.911fps -7Core2と傾向は同じですね。
69.548fps 浮動小数点 129.716fps 整数 32bit LLM 141.457fps 整数 32bit AP-922・・・MTなavisynth.dllだとダメなんですかね?
2011, 11/18 Ver. 0.7.5a
Intel Composer XE 2011 update.7 (icl ver. 12.1.1.258) でリビルド
(ver. 0.7.5 で遅くなったと報告があり、このバージョンで解消が確認できたため)
107.043fps 浮動小数点 216.097fps 整数 32bit LLM 245.187fps 整数 32bit AP-922をぉ、確かに0.75に比べて劇的に早くなってます。