最近在筆電(Windows 11 + GeForce RTX 3060 Laptop GPU)上配置深度學習環境,發現 mmcv 常因 CUDA/cuDNN 版本錯配而 import failure(如 DLL load failed)。試過多種組合後,目前最穩定的方案如下:
✅ 環境清單
CUDA: 11.8(使用 conda install cudatoolkit=11.8 -c nvidia)
cuDNN: 自動由 conda 安裝(不手動下載!)
PyTorch: 2.1.2+cu118(官網指令:pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118)
mmcv: 直接安裝預編譯 wheel(避開 mmcv-full 編譯地獄!)
→ 對應版本:pip install mmcv==2.1.0 -f https://download.openmmlab.com/mmcv/dist/cu118/torch2.1/index.html
💡 關鍵心得:千萬別混用 pip 與 conda 安裝 CUDA 相關套件,否則會出現 CUBLAS_STATUS_NOT_INITIALIZED。建議全程用 conda 建 env,再用 pip 裝 mmcv。
用 RealBasicVSR 對 720p/24fps 動畫做 4x 超解析時,發現人物快速移動場景(如打鬥)會出現「重影」與「邊緣抖動」。推測是因為 VSR 模型依賴時序連續性,而低幀率導致光流估計失準。
🛠️ 我的改善三步驟:
預處理升頻:先用 ffmpeg -r 60 將 24fps 插幀至 60fps(使用 minterpolate 濾鏡),再餵進 RealBasicVSR;
調整 --scale 參數:不直接 4x,改用 2x → 再 2x 分階段放大,減少單次形變;
後處理去閃爍:用 Flowframes 的時序平滑功能二次過濾。
結果:重影減少約 70%,雖增加處理時間,但對「高動態場景」質感提升明顯。
📌 建議:靜態場景可直接 4x;高速動作片段務必插幀+分段放大!