基于深度強化學(xué)習(xí)的不確定作業(yè)車間調(diào)度方法
摘要: 作業(yè)車間調(diào)度是具有非確定性多項式(Non-deterministic polynomial,NP)難的經(jīng)典組合優(yōu)化問題。在作業(yè)車間調(diào)度中,通常假設(shè)調(diào)度環(huán)境信息已知且在調(diào)度過程中保持不變,然而實際調(diào)度過程往往受到諸多不確定因素影響(如機器故障、工序變化)。本文提出基于混合優(yōu)先經(jīng)驗重放的近端策略優(yōu)化(Proximal policy optimization with hybrid ... (共15頁)
開通會員,享受整站包年服務(wù)