DEVELOPER’s BLOG
技術ブログ
- トップ
- 技術ブログ
はじめに 前回の「画像セグメンテーションのためのU-net概要紹介」では画像のクラス分類のタスクを、画像のSegmentationのタスクにどう発展させるかを解説し、SegmentationのネットワークであるU-netの理論ついて簡単に解説しました。 今回はTensorFlowのSegmentationのチュートリアルを行いながら、実際にU-netを学習させてみたいと思います。 尚、本記事ではTensorflowの詳しい解説は行いません。 参考 : ht
はじめに こんにちは、システム部の譚です。 Google Colablatoryで、手書きの数字(0, 1, 2 など)から構成されているMNISTデータセットを使い、分類問題のニューラルネットワークを構築してみました。 目次 はじめに モデルを構築する おわりに モデルを構築する 手順 1.TensorFlowのモデルを構築し訓練するためのハイレベルのAPIである tf.kerasを使用する。 from __future__ import absolut
目次 はじめに:Fairness in Machine Learningとは データとバイアス Discrimination"(差別)とは? "Fairness"(公平性)とは?
はじめに iOSネイティブアプリと機械学習を組み合わせたいと思い、Appleが提供してくれているフレームワークCore MLとVision、事前に訓練したInception v3モデルを使用し、ドラマのSilicon Valleyに出たthis is not hot dogアプリを作ってみました。 this is not hot dog とは、撮影された画像がホットドッグかどうかを認識するアプリです。YouTube動画がありますのでご覧ください。YouT
LightgbmやXgboostを利用する際に知っておくべき基本的なアルゴリズム「GBDT」を直感的に理解できるように数式を控えた説明をしています。 対象者 GBDTを理解してLightgbmやXgboostを活用したい人 GBDTやXgboostの解説記事の数式が難しく感じる人 ※GBDTを直感的に理解してもらうために、簡略化された説明をしています。 GBDTのメリット・良さ 精度が比較的高い 欠損値を扱える 不要な特徴量を追加しても精度が落ちにくい 汎
アクセルユニバースの根岸です。 突然ですが、お寿司は食べますか?日本に住んでいて食べたことない人はほとんどいないと思います。ということは何を食べているのか判断できるのは当然の教養ですよね。一方で私のようなお寿司に疎い人もいるわけで、なんとなく美味しいで終わってしまうのはもったいない。そんな時にこそ機械学習を使って解決してみましょう。 ということで、本記事ではネットからお寿司の写真を入手して機械学習(画像認識)を用いてお寿司を判別するためのモデル構築を行うま
GBDTのひとつ、Catboost GBDTという手法がKaggleなどでもメジャーなものになってきました。 今回はそんなGBDTライブラリの一つで比較的新しいCatboostについて見ていきます。 Catboostは、ロシア最大手検索エンジンサイトであるYandex社から2017年にリリースされ、11月29日現在v0.20まで公開されています。その革新さをいくつかあげられていたのでそれらをこちらの論文に沿いながら確認していきます。 目次 カテゴリ
今回は初めて統計学を勉強しよう、統計検定を受けようという 文系の大学生 文系出身のビジネスマン このような方に向けて、勉強方法やおすすめの本について紹介していきます。 今回紹介する本の内容をマスターすると、統計検定2級の合格や機械学習の本を理解できるようになります。 目次 自己紹介 なぜ統計学の勉強が大変なのか 本の紹介 自己紹介 僕は現在、大学3年生で文系の学部に所属しています。 統計学を勉強したきっかけは以下の2つです。 データを分析するのに必要なた
※本記事の対象:自然言語処理という言葉は聞いたことはあるが、どういうアプローチで処理がされているかイメージが湧かない方(大学レベルの数学の知識は必要) ※内容はオーム社『ゼロから学ぶDeep Learning2』を参考にしている 目次 1. はじめに:自然言語処理(NLP)とは 2. シソーラスによる手法 3. カウントベースの手法( 統計的手法 ) 4. カウントベースの手法の改善点 5. 【次回】word2vec( ←これがメイン ) 6. まとめ
問2に続いて問3です。 同じくご指摘があればコメントをお願いします。 また、問1と問2はこちらをご確認ください。 合格記も書きました。 [1] \(X_1, X_2, \cdots , X_n\)の同時確率密度関数 \[ f(x_1, x_2, \cdots, x_n) = \begin{cases} \frac{1}{\theta ^n} & (x_1, x_2, \cdots , x_n \leq \theta)\\ 0 & (otherwi
問1に続いて問2です。 同じくご指摘があればコメントをお願いします。 [1]\(U\)の期待値\(E[U]\)を求めよ。 \begin{equation} E[U] = E[X_1+X_2] = E[X_1]+E[X_2] \ (\because X_1, X_2は互いに独立) \end{equation} 今、\(X_i\)(\(i=1, 2\))について、 \begin{eqnarray*} E[X_i] &=& \int_0^\infty x
2019年11月24日に実施された統計検定1級を受験しました! 略解は既に公開されているのですが、改めて勉強したい人(僕もその1人ですが...。)のために解答を共有します。 少しでも役に立つと嬉しいです。。。 本記事では統計数理の問1、次記事で問2を解説していきます。 [1] 確率母関数の1階および2階微分はそれぞれ \[ \frac{d}{dt}G_{X}(t) = \sum_{k} kt^{k-1}P(X=k) \] \[ \frac{
目次 はじめに:機械学習の社会実装 自動運転は実現可能か? 人間は機械学習技術を使いこなせるか? 機械学習の判断を人は受け入れられるか? 『より良い』とは? おわりに はじめに:機械学習の社会実装 『機械学習』という言葉を聞いて何を思
もくじ 機械学習の概要 人工知能と機械学習の違い 機械学習の種類 機械学習のプロセス 機械学習のこれからの発展 まとめ 機械学習の概要 機械学習とは与えられたデータからデータに潜む規則性を自動的に発見し、データの分類や未知のデータの予測をコンピュータの計算手法を利用して行うことである。データから予測を行うとき、扱うデータによっては膨大な規則を用いたり、人力では見つけることの難しい規則が存在したりするので、人間だけでは予測が困難な場合があるが、それをコン
「機械学習」 耳にすることが多くなった単語ですが、そもそも機械学習ってなんでしょうか。 AI(人工知能)との違いは?なにが出来てなにが出来ないのでしょうか? 本日は上記を解説し、実際に活用されている事例をご紹介します。 機械学習とは 機械学習はAIの1つの要素です。 AIの中に機械学習があり、機械学習にディープラーニング(深層学習)があります。 機械学習とは... 大量のデータの特徴や法則を捉え、未知のデータを予測・分類する。 分析の精度は100%ではない
アクセルユニバース株式会社(以下 当社)では『機械学習・深層学習で世界を笑顔にする』を掲げ、人が対応している業務を画像認識、音声認識、文字認識等を活用して効率化する機械学習ソリューション開発をおこなっています。 今日は世界を笑顔にしたい私が 「ドラえもんのひみつ道具があれば、みんな笑顔になるのではないか!?」と機械学習を活用してひみつ道具の実現を考えてみました。 目次 ひみつ道具の検討 実現したいこと 結果と今後 ひみつ道具の検討 ずばり、今回実現を検討し
はじめに 現代社会には、音楽というものが氾濫しています。 そして多くの人は音楽を聞くというと、生演奏されているものを聞くことよりもCDやサブスク型サービスなど、一度デジタルなデータになったものをアナログデータへ変換して視聴することの方がよっぽど多いでしょう。 このデータ化によって普段聞いているだけでは気づかないような、特徴、性質に目を向け、そういった見えなかったデータを使い既存のものをもっと充実させる、新しいものを作り出すことはできないでしょうか。 この
この記事では、3ヶ月前までデータサイエンスと無縁だった私が、 マイナビの家賃予測コンペで上位8%(スコア14953)に達した解法について紹介したいと思います。 始めまして、 アクセルユニバース株式会社、インターンの土井です。 ここで紹介するSIGNATEの解法は、私が始めて間もないこともあり、シンプルな解法ばかりです。 幅広いレベルの方の参考になれると思います。 コンペの概要 https://signate.jp/competitions/182 東京23
目次 このブログの対象者 地震コンペの概要 私が地震コンペを始めた理由 Kaggle初心者が地震コンペをやるまで 地震コンペの情報収集 参考にするNotebookの解読 特徴量の作成 モデルの作成 結果 考察 今後 1. このブログの対象者 Kaggle初心者 Kaggle入門者用のTitanicや住宅価格コンペの次に挑戦したいが進め方に悩んでいる人 地震コンペ(LANL Earthquake Prediction)のような時系列の信号データの分析に興味を
アクセルユニバース株式会社(以下当社)では、人が対応している業務を画像認識、音声認識、文字認識等を活用して効率化する機械学習ソリューション開発をおこなっています。 インターン生はその一環としてkaggleコンペに挑戦しており、本日はkaggle Expertになった山口くんに取り組みをインタビューしました。 kaggleコンペに挑戦している方、これから機械学習の勉強を始める方は是非参考にしてください! 目次 山口くんの紹介 kaggleコンペ挑戦 kagg
U-netとは U-netはFCN(fully convolution network)の1つであり、画像のセグメンテーション(物体がどこにあるか)を推定するためのネットワークです。 生物医科学(biomedical)の画像のセグメンテーションを行うために2015年に発表されました。 (論文URL : https://arxiv.org/abs/1505.04597) この記事では、まずU-netの中で行われている処理についてを1〜4章でまとめ、それらの組
現在、多くの業界でAI・機械学習の重要性が増加しています。 背景のひとつに労働人口の減少による人手不足があります。帝国データバンクの調査によると、「正社員不足」状態の企業は全体の50.3%を占めています。 人手不足も解消のためには、業務自体を削減すること、または業務を人から代替する必要があります。 ここでは人間の目の代わりとなり、判断をおこなう機械学習である画像認識技術を紹介します。 スタンフォード大の研究者らがAI関連の研究開発や経済、教育、各国の動向な
はじめに 最近天気が不安定で、急な雨が多くまいっています。(しかも冬の雨はツライ。) ついつい出かける時に傘を持たずに、夜、雨に降られることも多いですよね。 現在、Pythonを使った機械学習を勉強しているので、kaggleだけではなく、実際にテーマを決めて何か簡単な実装をしてみたいと思い、今回は気象庁のデータを使って ある日に雨が降っている or いないという2値の予測を実装をします。 自分で作ると愛着が湧いて、ちょくちょく予測して傘を忘れずに済むだろう
はじめに ニューラルネットワークの学習の目的は、損失関数( loss function )の値をできるだけ小さくするようなパラメータを見つけることに他ならない。これは言い換えれば最適なパラメータを決定するという点で最適化問題に帰着されるが、ニューラルネットワークの最適化はそのパラメータの数の多さから大変複雑な問題として扱われる。 今回はSGD, Momentum, AdaGrad, Adamと呼ばれる4つのパラメータ更新手法を紹介し、最後にMNISTデータ
お問い合わせはこちらから