学科分类
/ 1
3 个结果
  • 简介:Amultiresolutionstate-spacediscretizationmethodwithpseudorandomgriddingisdevelopedfortheepisodicunsupervisedlearningmethodofQ-learning.Itisusedasthelearningagentforclosed-loopcontrolofmorphingorhighlyreconfigurablesystems.Thispaperdevelopsamethodwherebyastate-spaceisadaptivelydiscretizedbyprogressivelyfinerpseudorandomgridsaroundtheregionsofinterestwithinthestateorlearningspaceinanefforttobreaktheCurseofDimensionality.Utilityofthemethodi...

  • 标签: 加强学习 MORPHING 随机的格子
  • 简介:这篇论文基于多客观的最佳的控制系统建议非线性的控制器和一个大阶段角度津贴设计方法的一种新类型。与建议方法,系统的性能变得比原来的系统的好。然后,雷达伺服系统的一个例子与大阶段角度津贴被设计多客观的最佳的设计方法。最后,性能基于计算机模拟证明多客观的最佳的系统比线性最佳的系统优异。

  • 标签: 多目标优化控制 自适应控制器 优化控制系统 优化设计方法 非线性控制器 雷达伺服系统
  • 简介:Aprimarychallengeofagent-basedpolicylearningincomplexanduncertainenvironmentsisescalatingcomputationalcomplexitywiththesizeofthetaskspace(actionchoicesandworldstates)andthenumberofagents.Nonetheless,thereisampleevidenceinthenaturalworldthathigh-functioningsocialmammalslearntosolvecomplexproblemswithease,bothindividuallyandcooperatively.Thisabilitytosolvecomputationallyintractableproblemsstemsfrombothbraincircuitsforhierarchicalrepresentation...

  • 标签: 分散的 Markov 决定过程 加强学习 Multiagent 系统