国产日韩欧美久久久精品图片|国产综合有码无码中文字幕|国产一区二区综合视频|国产亚洲精品电影网站在线观看|国产精品一区在线

機械社區

 找回密碼
 注冊會員

QQ登錄

只需一步,快速開始

搜索
查看: 9457|回復: 11
打印 上一主題 下一主題

如何讓機器人通過自學習的方式學會玩“石頭、剪刀、布”游戲?

[復制鏈接]
跳轉到指定樓層
1#
發表于 2016-4-8 17:44:57 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
本帖最后由 劉景亞 于 2016-4-11 18:26 編輯 ' K) f  ~9 t( v  ~! Q
0 O6 p3 @; R; v
前段時間的人機圍棋大戰賺足了人們的眼球,Google公司的AlphaGO也使機器學習和深度學習讓更多的人有了一定的了解,可謂做了一次很好的科技普及。. F9 a, B8 X2 ]
現在我們從簡單問題入手,如何基于機器學習,通過自學習的方式讓機器人學會玩“石頭、剪刀、布”游戲?
& s0 j+ f* ~6 g' u0 l不知大家有何建議?歡迎大家發言參加討論。
3 u; x& `: |- D* k1 W2 i  r
*******************************************************************************************
4 o+ u) h5 G  @$ K. ~# _& r3 q8 p分割線以上為原貼% ?4 I4 G5 e) M& }/ j
*******************************************************************************************
& V- X+ n) H9 _) z2 i+ @非常感謝各位大俠的參與和討論。
, c7 b; z1 G; \: V關于機器人玩“石頭、剪子、布”游戲,我本打算分三個問題和步驟和大家一起探討。看到討論中,大家對這三個方面都有所涉及。6 I0 o( g$ @( \4 F; E+ i
下面我把我對這個問題的認識拋出來與大家交流分享。. ~4 p: A* g0 c, w2 T$ K
要讓一個機器人玩“石頭、剪刀、布”,我們分三步走。" @6 _$ E( [  j1 u7 u9 ^
第一步,如何讓機器人通過自學習的方式學會游戲規則?比如,一開始機器人并不知道石頭、剪子和布,哪個贏哪個,要玩游戲首先得學會規則。當然要實現這一步,有比較簡單的辦法,最直接的是程序員編程時,直接定義這個規則,這是以前經常用的傳統的方法。現在我們想通過一種新的方法來實現,讓機器人像小孩一樣,通過不斷地實踐、摸索和總結掌握這個規則,也就是自學習和機器學習。  P: K. C- t- f$ N
第二步,如何讓機器人在掌握規則后大概率獲勝?
+ i. \( t5 g% p) `+ R第三步,能不能通過一種方法,使機器人在每局對戰時100%獲勝?0 w# }) C" z- w& X
*****************************************************************************************
. T! ~# }; v- T' q* y. v關于第一步,可以用如下方法實現:讓機器人和人對戰,在對戰的實踐過程中訓練機器人,使其不斷自學習以掌握規則。在對戰,人始終隨機出,機器人一開始并不知道規則,也隨機出。贏了有獎勵,輸了有懲罰,隨著對戰次數的增多,機器人就會對出拳的種類形成“價值判斷”。在訓練過程中,機器人會反復判斷,是隨機出還是基于已經學到的部分知識。經過不斷訓練,機器人就會學會游戲規則。這個過程區別于以往的程序員直接定義,和人類的學習過程十分類似。
" L5 m5 P4 @) z那么這個方法有沒有效果,我們驗證一下。
. N7 P* M9 a* @下圖是我與機器人玩25局的情況,注意這個機器人一開始并不知道游戲規則。我隨機出拳,機器人一開始也隨機出,贏了獎勵,輸了懲罰。大家會發現,從第11局開始,機器人就已經完全掌握了規則。
* l6 Z" d  u2 H: @2 b; P! X% S$ @& ?" L* o# p; [' L. e

! H' C' u0 L$ `1 V1 h( U4 S
& {0 b8 c6 c5 u
4 \4 D- C. t6 M1 `% ?# l. z# m5 n6 p2 e3 o3 N9 T6 e% A

本帖子中包含更多資源

您需要 登錄 才可以下載或查看,沒有帳號?注冊會員

x
回復

使用道具 舉報

2#
發表于 2016-4-8 17:54:56 | 只看該作者
這種純概率的東西,要做算法是很簡單,但是勝率要提上去不容易啊

點評

我們要想一種方法,最終實現100%獲勝。  發表于 2016-4-11 18:20
回復 支持 1 反對 0

使用道具 舉報

3#
發表于 2016-4-8 18:15:31 | 只看該作者
應該上一個圖形處理系統,先分辨對面這家伙是誰,再決定怎么玩,
2 t2 f5 @7 T0 l- v
# ^0 k6 T7 D3 h0 M. S' X人的活動,是有固定姿態的,比如下一步怎么活動,有細微表現,總結了這些姿態,就可以勝了對面的家伙,/ y6 \* |! o$ M
5 L8 B1 H5 g6 _2 k1 W

點評

998大俠高人,這是我們做這個系統的最終目的和最高境界。  發表于 2016-4-11 18:21
8也的觀點讓我想起了那個很有名的猜拳理論。高舉拳,將注意力放在對方的手上,在出手的一瞬間,按照人的行為習慣,手會有一個瞬時的形態變化,據此可判斷對方出的是什么。只要眼力好,勝率超過95%  發表于 2016-4-9 02:24
8爺,久仰大名。他表達的不是這個意思,他舉得是圍棋的例子。所以他想要知道的是邏輯上的自學習,簡單點說,就是第一次和這個人下棋因為走這一步輸了,下次他就不會再走這步了。是類似這種邏輯怎么用程序實現,  發表于 2016-4-8 20:04
8爺,久仰大名。他表達的不是這個意思,他舉得是圍棋的例子。所以他想要知道的是邏輯上的自學習,簡單點說,就是第一次和這個人下棋因為走這一步輸了,下次他就不會再走這步了。是類似這種邏輯怎么用程序實現,  發表于 2016-4-8 20:03
八爺學過心理學吧,我有一親戚,以前流行喝酒猜拳的時候,陌生人頂多剛開始會輸幾把。熟人逢他必喝,假如他想喝了才會故意輸。就是機靈,觀察細致  發表于 2016-4-8 18:22
回復 支持 反對

使用道具 舉報

4#
發表于 2016-4-8 18:38:22 | 只看該作者
本帖最后由 crazypeanut 于 2016-4-8 18:39 編輯 $ |3 Z4 _& E: c" r) M+ y

. B1 s) m- s6 A5 c, k3 u$ L2 ?如果不考慮心理學因素的話,猜拳不是博弈系統,是一個純概率系統,樣本空間為(剪,石),(剪,布),(剪,剪),(石,剪),(石,布),(石,石),(布,剪),(布,石),(布,布)$ R& T4 I; z+ A. M  ^" B; }- p' U4 c
- n1 R  m" [3 R9 e4 V! Z- m
獲勝組合是(剪,布),(石,剪),(布,石),概率為1/3,相應的,平局組合和輸掉組合均為1/3
9 U: B4 u- ?' a+ ]7 C' X! |/ d: b7 r3 A6 }+ H8 E4 ^
因此,如果沒有心理學算法在里面,用隨機算法隨機選擇出拳的話,獲勝幾率不會超過1/3
3 ~: e* v$ W) s( ^6 I) U% q- Z5 r' Q) ], U4 Q6 ]9 T
而將心理學因素考慮進去,就像8爺所說的,要加上圖形系統,增加了復雜性,也偏離了正道+ s# K  d2 B" ]0 k0 ?3 L/ V/ G  k
# t) D9 D7 t9 A% f
個人建議,選擇五子棋或者黑白棋作為研究對象更合適,五子棋和黑白棋應該算是最簡單的博弈系統了,棋子就黑白兩種,相對容易處理5 i7 H: a# ?' |5 r) E" P

  [! X8 N# W, S. _( l$ |/ e4 @4 D有人可能說井字棋更簡單,但是作為博弈系統,井子棋有不敗的策略,沒有太大的研究價值

點評

我在主樓對該系統做了進一步說明,歡迎探討交流。  發表于 2016-4-11 18:22
之前好像有一個日本的機械手,就是這么干的,動作相當靈活  詳情 回復 發表于 2016-4-8 19:06
998那方法,是“作弊”的方法,相當于滯后一步。要是根據上一步出法,就是考慮心理學,博弈和統計,求個概率勝法。  發表于 2016-4-8 18:56
回復 支持 反對

使用道具 舉報

5#
發表于 2016-4-8 19:06:20 | 只看該作者
crazypeanut 發表于 2016-4-8 18:38 0 g: r1 B6 X) p- K% v
如果不考慮心理學因素的話,猜拳不是博弈系統,是一個純概率系統,樣本空間為(剪,石),(剪,布),(剪 ...
& s7 c$ L8 F6 q, k% O1 W9 r
之前好像有一個日本的機械手,就是這么干的,動作相當靈活* B5 u0 d+ S9 k  M6 e2 W

點評

實質就是這樣的了,又不是下象棋。象棋之類的話還要一個內核,一個掃描和伺服。你就石頭剪刀布的話就用幾個氣缸也可以控制手勢  發表于 2016-4-11 19:17
日本東京大學的研究室  發表于 2016-4-11 18:22
回復 支持 反對

使用道具 舉報

6#
發表于 2016-4-8 19:54:31 | 只看該作者
     玩石頭剪刀布沒問題。很簡單。生成1 2 3 隨機數分別代表石頭剪刀布。  自學習估計這個論壇里懂得就少了。去個程序員論壇估計能弄明白自學習的程序的都不多。頂多就是 分析下 這個人出什么的概率,和出完什么再出什么的概率。然后弄個算法分析下他會出什么的概率最大。再高科技點,就分析他出什么之前的渾身表情動作等。

點評

歡迎交流探討  發表于 2016-4-11 18:23
回復 支持 反對

使用道具 舉報

7#
發表于 2016-4-8 20:25:16 | 只看該作者
這是一個隨機概率的問題,石頭,剪刀,布就是三個動作點,然后隨機輸出一個動作點就會呈現一個動作就好了,從理論上來講是完全可行的

點評

實質就是這樣的了,又不是下象棋。象棋之類的話還要一個內核,一個掃描和伺服。你就石頭剪刀布的話就用幾個氣缸也可以控制手勢  發表于 2016-4-11 19:17
這個思路可進一步探討  發表于 2016-4-11 18:24
回復 支持 反對

使用道具 舉報

8#
發表于 2016-4-8 20:45:29 | 只看該作者
樓主的意思應該是“如何讓機器人學會玩剪刀石頭布”,而不是“使機器人玩”剪刀石頭布吧……+ m! C) F+ ], V6 z' e- m9 G4 R' j' d5 u' z0 n
樓上都跑偏了吧

點評

大家討論的問題都會涉及,我在主樓做了進一步說明。  發表于 2016-4-11 18:24
回復 支持 反對

使用道具 舉報

9#
發表于 2016-4-9 07:58:07 | 只看該作者
可以根據對方出拳的情況,用多項式擬合,然后用多項式預測下一步對方出什么,對方每出一次拳,就修正多項式

點評

這個方法可行性可進一步討論  發表于 2016-4-11 18:25
回復 支持 反對

使用道具 舉報

10#
發表于 2016-4-11 10:14:52 | 只看該作者
用上“分歧終端機”呢,非誠勿擾里的那個

點評

可作為應用案例  發表于 2016-4-11 18:25
回復 支持 1 反對 0

使用道具 舉報

您需要登錄后才可以回帖 登錄 | 注冊會員

本版積分規則

小黑屋|手機版|Archiver|機械社區 ( 京ICP備10217105號-1,京ICP證050210號,浙公網安備33038202004372號 )

GMT+8, 2025-5-15 03:35 , Processed in 0.068700 second(s), 19 queries , Gzip On.

Powered by Discuz! X3.4 Licensed

© 2001-2017 Comsenz Inc.

快速回復 返回頂部 返回列表
主站蜘蛛池模板: 少妇人妻系列无码专区视频| 成人试看120秒体验区| 日本精品一区二区在线看| 色先锋资源久久综合5566| 91人妻一区二区三区| 日韩欧美一区二区国产| 乱人伦人妻中文字幕在线入口| 亚洲视频在线第一区| 黑人玩弄漂亮少妇高潮大叫| 久9视频这里只有精品| 无限看片在线版免费视频大全| 国产精品无码mv在线观看 | 一区二区在线欧美日韩中文| 久久久人妻精品一区二区三区99| 丝袜视频在线观看一区| 精品一区二区三区无码视频| 任你躁在线精品免费| 亚洲精品专区成人网站| 国产无套粉嫩白浆在线观看| 九九99亚洲精品久久久久 | 亚洲欧美日韩一区二区| 亚洲一区二区三区女教师| 5个黑人躁我一个视频| 2020国产精品午夜福利在线观看 | 日本熟妇一区二区三区| 老妇女性较大毛片| 99久久国产综合精麻豆| 人妻无码中文字幕| 无遮挡又爽又刺激的视频| 人人妻人人澡人人爽精品欧美| 男女做爰猛烈啪啪吃奶动 | 免费看成人aa片无码视频吃奶| 亚洲国产精品原创巨作av| 欧洲少妇性喷潮| 国产精品无码无在线观看| 天天天欲色欲色www免费| 亚洲中文字幕av一区二区三区| 国产综合色一区二区| 日本一区二区三区在线播放视频| 国产精品无码久久久久| 久久夜色精品国产欧美乱|