抱歉,您的浏览器无法访问本站

本页面需要浏览器支持(启用)JavaScript


了解详情 >

lornd's Blog

学算法时一定要想怎么去改进!

吴恩达机器学习知识速查

第一章 绪论 机器学习 Arthur Samuel 的定义:在不被明确定义的情况下,给予计算机学习的能力的研究领域。 Tom Mitchell 的定义:计算机从经验 EEE 中学习,解决某一任务 TTT ,进行性能度量 PPP 。通过 PPP 评测其在任务 TTT 上的表现,这个表现会因为 EEE 而提高。 常见的机器学习算法:监督学习、无监督学习。 监督学习 监督学习给予机器学习算法一个包...

强化学习推荐系统论文导航

DRN: A Deep Reinforcement Learning Framework for News Recommendation 目标:最大化用户满意度,包括点击标签和用户活跃度。 状态:新闻特征、用户特征、用户新闻特征、上下文特征。 动作:新闻推荐列表。 奖励:用户是否点击推荐的新闻,以及用户活跃度。 基于 Double DQN 和 Dueling DQN 。 探索过程:对原始网络...

[论文解读] DRN: A Deep Reinforcement Learning Framework for News Recommendation

论文地址:DRN: A Deep Reinforcement Learning Framework for News Recommendation 。 研究背景 由于新闻特征与用户偏好特征是不断发生变化的,在线个性化新闻推荐是一个很有挑战性的工作。现在已经有一些个性化新闻推荐的模型,如基于内容的方法、基于协同过滤的方法、混合方法等。但是这些方法存在着以下问题: 这些方法只对即时奖励(如点击...

[解题报告] 力扣双周赛 73D

这道题目使用的贪心非常大胆(在做的时候没有想到),特此记录。 题目地址:2193. 得到回文串的最少操作次数 - 力扣(LeetCode) 题目大意 给定只包含小写英文字母的字符串 sss 。每一次操作,可以选择 sss 中两个相邻 的字符,并将它们交换。求将 sss 变成回文串的最少操作次数。 保证给定的字符串能够变成回文串。 ∣s∣≤2000|s| \le 2000∣s∣≤2000 。 ...

[强化学习从入门到入土] 强化学习基础

申明:本系列为《深度强化学习:基于 Python 的理论及实践》一书及相关论文的学习笔记。 从零开始的强化学习,那必然要先了解一些最基本的概念,为之后算法的学习打好基础。 引入 在日常生活中,我们经常会碰到一些顺序决策问题(任务),如下棋、驾驶等。在这些问题中,首先,我们会有明确的目标:赢下这一场棋,或者是安全到达目的地;其次,我们每采取一个动作,都需要接受外界的的反馈,如棋盘上局势的优劣,...

蚁群算法与 TSP 问题

TSP 问题 旅行商问题(Travelling Salesman Problem,TSP):给定一系列城市和每对城市之间的距离,求解访问每一座城市一次并回到起始城市的最短回路。 蚁群算法 蚁群算法(Ant Colony Optimization, ACO)是人们受到自然界中蚂蚁在寻找食物过程中发现路径的行为启发而提出的一种算法。因此,要理解蚁群算法,我们需要先理解蚂蚁发现路径的行为。 众所周...

2020 年度总结

不得不说,音乐会才是慰藉心灵的最好方式。看完 “最美的夜” 之后,时钟拨到 2021 ,再来回顾 2020 ,想过很多总结的词语,现在心中只剩下了一个:感谢。 感谢疫情。虽然它一点也不讨人喜欢,甚至搅扰了世界线的正常律动,但是也让我明白了我家的屋顶能够看到多么美丽的风景,“上房揭瓦” 的快乐,不仅仅是三岁小孩所独有的。头顶上湛蓝的天空,天空下远方的群山,山沟里热闹的小城,小城中错落的房屋,屋...