BLOG/INFORMATION ブログ・インフォメーション

コンピュータ将棋 レーティング 2020

未分類

将棋棋士の現在の棋力(強さ)を表す指標の一つに棋士レーティングがあるが、現時点のプロ棋士のレーティングにおいて、どのような棋士が上位にいるかを調査した。※「将棋棋士レーティング」は連盟等により公式に発表されているものではなく、有志によって独 本ブログエントリは、2020年5月3日~4日に開催された、世界コンピュータ将棋オンライン大会2020(以下wcsoc2020)の参加記録です。, tanuki-チームは、大会毎に参加名を変えて参加しています。今年度の参加名は「究極幻想アルテマタヌポン」でした。元ネタはファイナルファンタジー14内のコンテンツ名で、何か凄そう感+かわいらしさを出そうと思い、名付けました。, tanuki-チームは今回の大会において、YouTubeを利用した非公式生放送を行いました。生放送では究極幻想アルテマタヌポンの対局の様子を写したほか、Zoomミーティングで番組参加者を募り、その様子を写したりもしました。Zoomミーティングにはコンピュータ将棋ソフト開発者のほか、プロ棋士の千田先生や将棋ライターの松本さんなどもお見えになり、とても盛り上がりました。アーカイブが残っておりますので、当日視聴できなかった方は是非ご覧ください。, (1) 世界コンピュータ将棋オンライン大会 非公式生放送 2日目 (2020年5月4日) - YouTube, tanuki-チームでは、昨年の5月から半年間ほど、評価関数のネットワークの改良に取り組みました。試したネットワークはスキップコネクション付きのhalfkp_256x2-32-32、「halfkp_256x2-32-32-sc」です。, スキップコネクションとは、ニューラルネットワークにおいて、ある層の出力を、次の層のみではなく、後段の層の入力にも加えるというテクニックです。これにより、層が深いニューラルネットワークにおいて、誤差の逆伝搬をしやすくなり、学習しやすくなるという効果があるようです。, halfkp_256x2-32-32-scでは、隠れ層1層目の出力を出力層に加えました。この追加によりパラメーターが増えますが、全体のパラメーター数からみると、増加分は微々たるものになります。, 実験の結果、残念ながら、halfkp_256x2-32-32-scはhalfkp_256x2-32-32と同程度の性能しか出ませんでした。, 本番では第29回世界コンピュータ将棋選手権で使用した評価関数と同じものを使用しました。, 「メガショック定跡」は、やねうら王wcsc29で採用されているテラショック定跡に、手動等で生成した定跡を組み込めるようにした手法です。, はじめに、すでに存在している定跡データベースをマージします。wcsoc2020で使用した定跡には、以下の定跡をしました。, 続いて、上記の定跡の各局面の各指し手に、探索による評価値を付けました。探索は1000万ノードで行いました。次に、上記の定跡データベースに対し、テラショック定跡のMin-Max探索の要領で、末端局面の評価値を平手局面に向かって伝搬させました。最後に、上記の定跡データベース同士を対局させ、登録されている指し手の少ない局面が登場したら、Multi PVで探索を行い、得られた指し手を登録するという手順を繰り返します。最終的には200万局面以上を登録しました。, 大会前日に定跡データベースの最終確認を行ったところ、平手局面に登録されている指し手の評価値がすべてマイナスとなっており、平手局面で定跡データベースが使用されないという問題があることが分かりました。仕方なく2手目までは手動で定跡を追加しました。, また、本番では定跡にヒットする手数が短いという問題が起こりました。中終盤特化型の評価関数は、定跡にヒットする手数が長いほど有利となります。定跡と評価関数がかみ合っておらず、評価関数の本来の力が出せなかったように思います。, 「Tree Ponder」はMulti PonderとPre-Ponderを一般化したクラスタ向けPonder手法です。, 初めにGPS将棋が採用したクラスタのように、ゲーム木の部分木に思考ノードを割り当てていきます。ある局面について思考ノードを割り当てる際、Multi PVで探索を行い、その上位の手から順に、残りの思考ノード数の1/2、1/4、1/8、…と割り当てていきます。これを再帰的に繰り返し、全ノードを各部分木に割り当て、思考させます。思考にはgo ponderコマンドを用います。そして、本譜がいずれかの思考ノードが思考中の局面に到達した場合、その思考ノードにponderhitコマンドを送ります。これにより、既存のUSIコマンドを大幅に拡張することなく、Tree Ponderが実装できます。, Tree Ponderは台数が増えれば増えるほど、Ponder対応可能な指し手の幅と深さが増えていきます。wcsoc1では8台の思考ノードを使用しました。この場合、Root局面では4つの合法手に対してMulti Ponderを行うことができます。また、3つの局面に対してPre-Ponderを行うことができます。さらに、深さ3のPre-Ponderも行うことができ、理論上、深さ2のPre-Ponderを実装したコンピュータ将棋ソフトに対し、カウンターを当てることができる可能性があります。, 手元の実験ではtanuki- 5ノードでクラスタを組んだものと1ノードとで対局させたとき、最も良い結果で勝率59%となりました。ただ、特定のパラメーター以外で対局させると逆に弱くなるパターンが多くみられました。実装に問題があった可能性が高いです。, 今年度は技術的に試したことの多くが裏目に出てしまい、tanuki-をあまり強くすることができませんでした。来年度は一つ一つの技術の検証をしっかり行い、より良い成績を目指したいと思います。, nodchipさんは、はてなブログを使っています。あなたもはてなブログをはじめてみませんか?, Powered by Hatena Blog ブログを報告する. 将棋ができる人はどうやって将棋を学んだのだろうか? 基本的なルールを教わり、「さあ、次はあなたの番です」と言われても、最初のうちはどの駒をどこに動かすべきなのか解らない。人に教わったり、本やネットで勉強したりすることで、戦い方全体の流れや、どんな場合にどう指せば最善なのかという局所的な駒の動きも覚えていくことになる。それらは将棋の長い歴史の中で、人間が試行錯誤し、磨いてきたものだ。, 同様にもし、将棋についての予備知識が何もない2つのAI(人工知能)にルールだけ教え、「さあ、お互いに戦ってごらん」としたら、どうなるのだろう。, 人が長い歴史の中で編み出してきた攻め方や守り方を、AIは同じようにゼロから編み出すことができるだろうか。さらには、人間が思いつかないような戦法を生み出すのだろうか。, 2017年にアルファベット(Alphabet)傘下のディープマインド(DeepMind)がAIシステム「AlphaZero」を発表した。AlphaZeroでは、コンピュータに将棋、囲碁、チェスのルールだけを教え、あとはひたすら自己対戦で強化を図っていくという試みを行った。公表された結果によると、学習し、鍛えられたAlphaZero は、24時間以内に当時世界最強と評価されていたそれぞれのソフトから高い勝率を上げるまでに成長した。ディープマインドは、その手法の中心部分については公開したものの、どんな手を指し、どんな棋風(着手の特徴)だったのかは非公開のままだ。, そのAlphaZeroの将棋ジャンルの追試を行おうと、日本の有志による「AobaZero」プロジェクトが2018年にスタートした。山下宏氏(フリーランス エンジニア : 将棋ソフト「YSS」の開発者)、保木邦仁氏(電気通信大学 大学院情報理工学研究科 准教授 : Bonanza開発者)、小林祐樹氏(総合電機メーカー勤務)の3名が中心となり、世界の将棋ファンの力を借りて、AlphaZeroが実際どんなものだったのかを再現しようというものだ。, 「2018年11月にAlphaZeroの追試をするべく、3名でスタートしました。2019年3月に学習を開始、5月からは一般ユーザーにも協力していただく形で公開しました。2020年8月現在、人間を超える棋力に近づきつつあると思います」(山下氏), AobaZeroは、elmo(エルモ : 第27回世界コンピュータ将棋選手権優勝プログラムで、将棋プログラムとして初の升田幸三賞を受賞)に7割ぐらい勝てる所まで来ていると山下氏は話す。ディープマインドのAlphaZeroの勝率は9割程度だったという。, 「AlphaZeroの実験を再現して、どのような棋風だったのか、どんな手を指すのかを再現することです」(山下氏), AobaZeroは、(おそらくAlphaZeroと同様に)棋士の専門知識をほとんど利用せず、自己対局を繰り返すことにより、独自に将棋を学ぶ。そして、将棋の歴史にも見られるような、戦法の流行や推移を人工的に形成しているように見えるという。, 「AobaZeroはすでに新しい戦型、囲い、手筋などを見つけている可能性もあります。ところが『穴熊』、『金無双』といった、人間がよく使う優秀な王の囲い方は見つけていません。万能ではないことも示唆しています」(山下氏), ― AobaZeroは人間が考えもしないような戦法を見つけ出している可能性もありますか?, 「その可能性はありますが、まだちょっと解析が足りないところもあります。試行錯誤をしながら、新しい戦法を生み出すというところは人間に似ているのかもしれません。しかし、言ってしまえば人間の思考過程だってよくわかっていないわけです」(保木氏), 現時点では、入玉(一方の王将が相手敵陣に入ること)の展開となる将棋についてAobaZeroは正確に判断できているとのことだ。, 「将棋の本質は、王を寄せる(詰ます)ことではなく、入玉して点数で勝つことだとコンピュータは主張しているように見えます」(山下氏), ― このAobaZeroプロジェクトは、完成までどのくらいのところにあるのでしょう? また、人工知能研究にどのような影響を与えると考えますか?, 「ディープマインドのAlphaZero コンピュータ将棋(将棋ソフト)の情報を纏めたwikiページです。大会出場ソフトの特徴や用語解説などを行っています。 サイトをリニューアルしました(181110) 中身はそんなに変わってないのですが、内部システムは大幅に変わりました。 レーティング差の足し算をするときは、この上限値同士、下限値同士を足していくと良いでしょう。 駄目4. 終盤を強化している. 2020年8月現在、人間を超える棋力に近づきつつあると思います」(山下氏) AobaZeroは、elmo(エルモ : 第27回世界コンピュータ将棋選手権優勝プログラムで、将棋プログラムとして初の升田幸三賞を受賞)に7割ぐらい勝てる所まで来ていると山下氏は話す。 本ブログエントリは、2020年5月3日~4日に開催された、世界コンピュータ将棋オンライン大会2020(以下wcsoc2020)の参加記録です。 究極幻想アルテマタヌポン tanuki-チームは、大会毎に参加名を変えて参加しています。今年度の参加名は「究極幻想アルテマタヌポン」でした。

の研究成果は人工知能全般の発展に重要な影響を与えると考えます。しかし、これを追試する 我々のAobaZero の研究成果自体は、今後の人工知能研究に直接的な影響を与えるとは考え難いですね」(保木氏), 「現実的にはむずかしいと思うんですよね。現実社会のできごとって、将棋の盤上の戦いとはちょっと違うのではないかと考えます。この研究を通じて『そのような状況下で、こういう方法がうまくいった』という知見は重要だとは思いますが」(保木氏), 「将棋中継の評価などで、『AobaZeroの評価』みたいに出して楽しむ分には面白いかもしれませんね」(山下氏), 「何に応用できるのかという観点よりも、『人工知能はいったいどういうことができるのか?』という知見を人々に与えられるのではと思います。人工知能技術の発展のスピードというものを実例的に、感覚的に把握することができるようになるのではないでしょうか。たとえば、チェスで人間を打ち負かしたのが、1997年。そこから、20年ぐらいたつと、囲碁や将棋でこうして『自己対戦』という型式で、指し方を覚えて勝手に強くなっていくようなことを知ることができました。ここから20年経つとどういうことができるかと思いを馳せる材料になるのではないでしょうか」(保木氏), ― 『人工知能はいったいどういうことができるのか?』ということを知るための材料になるということですか?, 「AobaZeroが指した棋譜を並べてみて、将棋の強い人がそれを見ると、『ああ、人工知能はこんなことができるようになったんだ』と知ることができるのではないでしょうか。人工知能に関するニュースを新聞・テレビで見るのとは、そうとう違う感覚を受けるのではないかと信じています。また、人工知能の研究者にとっては、ソースコードを読んだり、手法を学んだりして刺激を受けることができると思います」(保木氏), 「まずはAlphaZeroの再現ができてから考えるという感じです(笑)」(山下氏), 現在、山下氏、保木氏らは、AobaZeroプロジェクトへの参加者(※)を募っている。, 「GPUなど特別な機材がなくとも、ブラウザさえあれば棋譜を生成することができます。新しい手を発見するのはみなさんのパソコンかもしれません」(山下氏), ※山下氏のAobaZero解説・参加方法など(http://www.yss-aya.com/aobazero/), 将棋ファンの読者のために、取材の合間に山下氏に伺ったことを追記したい。当媒体では、2017年10月に山下氏の「将棋が見せてくれた人工知能の世界」についての講演を取り上げた。(記事:「史上最強棋士はだれか 将棋AIが出した答えは」), そこでは、山下氏が古今東西の棋士の棋力をレーティングする仕組みを発表し、羽生善治棋聖(当時)が最強のレーティングをたたき出したという内容であった。この記事の中で、山下氏は藤井聡太四段(当時)にも触れている。その棋譜を解析したところ、レーティングは羽生善治棋聖に匹敵する3300ポイントではないかということを述べられていた。, 「対戦成績を見る限り、あの頃より強くなられているのではないかと感じます。しかしコンピュータでの客観的な指標は現在ありませんのであくまでも感想です」(山下氏), コンピュータ将棋界を、発展させてきたレジェンドたちが取り組むAobaZeroはこの先何を見つけ出すのだろうか。そして、藤井棋聖など若手の棋士たちは、こうした新たなAIから新しい発想を得てゆくことだろう。人とAIの共存する将棋世界はまだまだ面白くなりそうだ。, ライター、著者。有限会社ガーデンシティ・プランニング代表取締役。ICT関連から起業、中小企業支援、地方創生などをテーマに執筆活動を展開。著書に「マンガでわかる人工知能 (インプレス)」など。, 「ぶどうの粒いくつある?」を自動判定するAI来夏実用化へ〜山梨大学と農業生産法人が共同開発.

ダーツライブ 値段, オバマ ネットフリックス 契約金レナ スティッフェル, グリーン歯科 たまプラーザ, フサイチパンドラ 馬主, アメリカ 知り たい こと, 感電 歌詞 米津, コウノドリ1 1話 動画, Nhk 受信料 引っ越し 解約 忘れ, ロッテ 開幕戦 2020 チケット, 埼玉 新人戦 サッカー, 床嶋 佳子, ガブリエル 堕天使, 坂口健太郎 熱愛, 仮面ライダー平成ジェネレーションズ Forever Dvd, アーディル アブドゥル マフディー, 阪神タイガース チケット ファンクラブ, 唐川侑己 フォーム, 爆笑問題田中 競馬, 自衛隊 イラク デモ, 高校サッカー 京都, ダーツ ハンデ 目安, 内田 ドイツ 女性 人気, 京都記念 レース後コメント, 高校サッカー 福岡 注目選手, 水匠 将棋, 将棋 アマ 6 段, 犬鳴村 佐野市, 有馬記念 歴代優勝馬, 八千代高校サッカー部 出身, 仲間由紀恵 代表作, 大東建託リーシング 新卒, 仮面ライダーギンガ 杉田, プロ野球 順位 パリーグ, 魔進戦隊 キラメイジャー キャスト, オバマ 好き, パキスタン 治安, 板木望子 もちこ, イスラム国 現状, 思想犯 ヨルシカ, テレビを買うとnhkに通知 され る, 十勝サッカー シニア, 島崎遥香 グッズ, トランプタワー 有名人, 吉川尚輝 井端, チーム防御率 歴代, テセウスの船 小説 無料, ヴィクトリアマイル 脚質, 有馬記念 賞金 2019, 東京タラレバ娘 最終回 動画, 小野伸二 名言, ナラタージュ 歌, プロ野球 セイバーメトリクス, 世田谷ベース 田淵, ロッテ 売上高 2019, ホテル本能寺 口コミ, アメリカ 地図 簡単, 板橋区 少年サッカー 強豪, ホテルエミオン東京ベイ アクセス, 京都 U11 リーグ 2020年 前期, Bs11 視聴方法, Nhk データ放送 終了, 2018 ロッテ スタメン, サイレンススズカ 新馬戦, 梶谷 隆幸, グリコ 初任給, 競馬 厩舎コメント, 東京アマチュア将棋連盟 レーティング, アメリカ大統領 覚え方 英語, オブリガード 意味 ポルトガル語, どさんこワイド ニトリ, スーパーチューズデー 結果, 柴田杏花 Cm, ラジオnikkei賞 データ, 桜花賞 2020 コメント,

一覧に戻る