DEVELOPER’s BLOG
技術ブログ
- トップ
- 技術ブログ
SNS、口コミでの評価と顧客満足度は深い関係があります。 今回は「ネガポジ判定」を用いて、顧客の要望を発掘していきます。 目次 ネガポジ判定とは 実装方法 今後の検討方針 参考文献 1.ネガポジ判定とは 自然言語処理分野に関する文章のネガポジ判定とは、AIが文章の内容がネガティブかポジティブか判定するものです。 今回は食べログからスクレイピングによって口コミ(お店の評価)を抽出し、それらを実際にネガポジ判定します。 判定結果、特にネガティブと判定されたもの
機械学習を利用して「エントリーシート自己PR分析サービス」を作成しました。 エントリーシートの評価や言いたいことが伝わるか、心配ですよね。 また、企業の採用担当者は膨大な数のエントリーシートを確認することはかなりの業務量かと思います。 「エントリーシート自己PR分析サービス」では、自己PRの内容を入力すると点数や頻出単語を表示します。 [2020年2月21日追記:デモ動画] 機能追加しました! ・自己PRそのものの採点ができるようになりました。 サービスの
概要 物体検知の分野ではCOCOと呼ばれるデータセットを使って、検知手法の精度に関して数値的な評価が行われます。2020年1月現在、トップの正解率を示しているのが、2019年9月に発表されたCBNetを用いた手法です。 今回は物体検知に関して全くの初心者の方でも理解できるように、この論文を解説していきたいと思います。(原著論文はこちら) 目次 前提知識 Backbone CNNベースの物体検知 モデルの評価 CBNetの構造 AHLC SLC ALLC D
最近扱われるデータ量は膨大です。それに伴いデータの見方を変え、かつては重要度が低かった点からも関係性を見出す必要があります。 そのために確率推論は多くの命題の生起する可能性を確率として記述することから始められ、条件付き確率と結合確率を1つずつ繋ぎ合わせ段階的に構成されています。 ベイジアンネットワーク(Bayesian network) 人工知能(AI)における確率推論の一つのモデルです。 イギリスの確率論研究家トーマス・ベイズが発案したベイズの定理に基づ
車を運転していてヒヤッとした経験はありませんか? 疲れや睡眠不足からついうとうとしてしまい、急ブレーキ...。 起こってはならない事故ですが、死亡事故の4割程度を居眠り運転による事故が占めるそうです。1人で運転していると頼れるのは自分だけ。音楽やガムで気を紛らわせるのも限界があり不安ですよね。 本日はAI・機械学習を活用した、居眠りを検知する仕組みをご紹介します。 実際に使ってみました。うとうとして目が半目になるとアラートを出します。 このAIは動画のよう
消費者や企業によって発生する廃棄物の処理・管理が課題として挙げられることが増えています。 包装材の削減などで最終的に発生するゴミの量が削減されてはいますが、ゴミの発生は無くなることはなく今後も少なからず発生します。 廃棄物の処理・管理は主に手作業で実施されていて膨大な労力とコストが生じています。これらの課題解決のためにAIが活用され始めています。機械学習、ディープラーニング、コンピュータービジョンなどのテクノロジーで、廃棄物管理の効率と生産性向上のためのソ
概要 小説を丸ごと理解できるAIとしてReformerモデルが発表され話題になっています。今回はこのReforerモデルが発表された論文の解説を行います。 自然言語や音楽、動画などのSequentialデータを理解するには広範囲における文脈の依存関係を理解する必要があり困難なタスクです。"Attention is all you need"の論文で紹介されたTransformerモデルは広くこれらの分野で用いられ、優秀な結果を出しています。 例えば機械翻訳
日々AIに関する技術は発展していき、その中でも自然言語処理に関するトピックには目が離せません。 Apple社のSiri、AmazonのAlexaなど人間と会話できる(対話型)AIを通して、そういった技術が私たちの身近な存在になってきました。 そのような中、2020年1月末にGoogleが凄まじいAIチャットボット「Meena」を発表しました。今回はこのMeenaから今後のチャットボットの可能性について考えていこうと思います。 そもそもチャットボットとは?何
こんなチャットボットを作りたい 仕事の休み時間に料理好きのメンバーからこんな話を聞きました。「なんでもいいが一番困る!!」 なんの話か分かりますでしょうか?この記事にたどり着いたあなたなら分かるはず・・・。 そう、「晩ご飯何でも良い問題」です! この問題、調べてみるとかなり多くの主婦の方々が悩んでいて、夫婦喧嘩の原因の1つでもあるようです。 奥さんは、洗濯をしたり、毎日食事を考えてたりでやることがいっぱい。 対して旦那さんは、仕事で疲れ果てて食事を考える元
線形モデル(linear model)は、実用的に広く用いられており、入力特徴量の線形関数(linear function)を用いて予測を行うものです。まず、説明に入る前に言葉の定義から紹介します。 線形回帰 データがn個あるとした時にデータの傾向をうまく表現することができるy=w_0×x_0+....+w_n×x_n というモデルを探し出すこと 正則化 過学習を防いで汎化性を高めるための技術で、モデルに正則化項というものを加え、モデルの形が複雑になりす
第1弾、第2弾に続き 第1弾:海洋エネルギー × 機械学習 〜普及に向けた課題と解決策〜 再生可能エネルギーの一つである海洋エネルギー発電の長所と課題とその解決策について触れた。 第2弾:海洋エネルギー × 機械学習 〜機械学習を利用した電力需要量予測による波力発電の制御〜 複数ある課題から「発電量と需要とのバランスが取りにくい」、「無駄な待機時間がある」を解決するために、電力需要量を予測を行った。必要な電力需要量が分かれば、その分量を発電できるように
このような課題はありませんか 不良品検査の人員不足で外注しており、コストがかかっている...【コスト削減】 ノウハウが引き継げずにベテラン検査員が退職し、検査に膨大な時間がかかっている...【人依存の解消】 利益率向上・働きやすい環境のために生産性を上げたい...【生産性の向上】 人によって判定にばらつきがあるため、品質にもばらつきが出てしまう...【品質向上】 どれも製造業のお客様からよく聞くお困り事ですし、改善には時間もお金もかかります。しかし、改善し
機械学習では、訓練データとテストデータの違いによって、一部のテストデータに対する精度が上がらないことがあります。 例えば、水辺の鳥と野原の鳥を分類するCUB(Caltech-UCSD Birds-200-2011)データセットに対する画像認識の問題が挙げられます。意図的にではありますが訓練データを、 水辺の鳥が写っている画像は背景が水辺のものが90%、野原のものが10% 野原の鳥が写っている画像は背景が水辺のものが10%、野原のものが90% となるように
はじめに 昨日まで開催されていたKaggleの2019 Data Science Bowlに参加しました。結果から言いますと、public scoreでは銅メダル圏内に位置していたにも関わらず、大きなshake downを起こし3947チーム中1193位でのフィニッシュとなりました。今回メダルを獲得できればCompetition Expertになれたので悔しい結果となりましたが、このshake downの経験を通して学ぶことは多くあったので反省点も踏まえて
こんにちは。 今回は「アイトラッキング」について紹介します! 皆さんは「アイトラッキング」という技術をどのくらいご存知でしょうか? 「アイトラッキング」とは、人間の視線の動きを追跡・分析する手法であり、視線推定技術とも呼ばれます。 この技術により、これまで調査者側からではわからなかった被調査者の無意識の「本音」がわかるようになりました。 この記事ではそんな素晴らしい技術、「アイトラッキング」がどんな場所、場面で使われているのかを調査し、その可能性について
はじめに KaggleのNFLコンペで2038チーム中118位となり、銅メダルをとることができました。以下に、参加してからの取り組みや、反省点を書いていきたいと思います。 コンペ参加前の状況 10ヶ月ほど前にTitanicコンペに参加してから、「Predicting Molecular Properties」と「IEEE-CIS Fraud Detection」というコンペに参加してみましたが、公開されているカーネルを少しいじってみた程度でメダルには到底届
アクセルユニバース株式会社(以下当社)では、人が対応している業務を画像認識、音声認識、文字認識等を活用して効率化する機械学習ソリューション開発をおこなっています。 インターン生は業務の一環としてKaggleに取り組んでおり、先日のASHRAE - Great Energy Predictor IIIにて銅メダルを獲得しました。 メダルを獲得した田村くんのコメントです。 今回は、他の方が提出したもののブレンド(混ぜる)の仕方を工夫しました。 まずはなるべ
業種別 機械学習導入・検討状況 2018年にIBMがおこなった調査によると、企業の82%はAIの導入を検討しており、金融サービス業界では既に16%の企業がAI システムを運用または最適化し、製造業がそれを追いかけるように導入・検討が進んでいます。 例えば、シーメンス、ジェネラルエレクトリック(GE)、ボッシュ、マイクロソフトなどの業界大手企業は、既に製造業のあらゆる部分を後押しするための機械学習アプローチによるAIの製造に多額の投資をおこなっているようで
はじめに 多くの機械学習モデルにおいて注意することの一つとして過学習(overfitting)があります。過学習は学習データに適合しすぎて未知のデータに適合できずに、汎化性能が低下してしまう現象のことを指します。DNNを例に取ると、モデルサイズを大きくしたり、エポック(epoch)及びイテレーション(iteration)を大きくしすぎるとモデルが過学習しすぎてテストエラー(汎化誤差)が大きくなってしまいます。ですが最近になって、一定以上を超えて上記のパラメ
リモートワーク・業務効率化を阻む紙 このようなことはありませんか? お客様アンケートを手集計している。 見積作成のために出社しないといけない。 紙の伝票処理に時間がかかっている。 コロナウイルスの影響もあり、リモートワーク化が進む中、上司のハンコを貰うのでリモートワークできない。という声も少なからずあるようです。紙書類の作業のために出社をしなけばいけない...。リモートワークに限らず、営業が業務日報や見積り作成で会社に戻ることは業務効率を大きく下げる要因で
概要 AI技術の発展が進み、今や私たちの身の回りでも当たり前のようにAIが生活をより便利にしてくれています。この夢のような技術を支えているのは研究者の方たちによる地道な努力です。では、最近はどのような研究が行われているのでしょうか? 研究の成果は論文という形で公開されますが、世界中で活発に研究されているAI関連の論文は1日に数十~百本もの論文が出ています。そのためこれらの論文を読んで最新の研究動向をつかむことは難しいでしょう。 そこで今回はテキストマイニン
今回は「じゃらんの口コミをスクレイピングしてみた」ということで紹介していきます。※この記事はスクレイピング初心者向けに書いています。 目次 1はじめに 2スクレイピング 3可視化 4分析・まとめ 5注意すること 6終わりに はじめに 皆さんは今年の冬をどのように過ごす予定でしょうか? 今回は「冬」「雪」といえば「スキー」「温泉」ということで、この二つのキーワードに関連するホテル・旅館の口コミを分析しました。LINEトラベルのサイトによると、温泉が楽しめ
アクセルユニバース株式会社(以下当社)では、人が対応している業務を画像認識、音声認識、文字認識等を活用して効率化する機械学習ソリューション開発をおこなっています。 インターン生は業務の一環としてkaggleに取り組んでおり、先日のNFL Big Data Bowlコンペにて銅メダルを獲得しました。 こちらのコンペは、アメリカンフットボールのランプレイにおいて、攻撃側が進むヤード数を予測するコンペです。 メダル獲得した小野くんのコメントです。 ーーー 主な勝
はじめに この記事では物体検出に興味がある初学者向けに、最新技術をデモンストレーションを通して体感的に知ってもらうことを目的としています。今回紹介するのはAAAI19というカンファレンスにて精度と速度を高水準で叩き出した「M2Det」です。one-stage手法の中では最強モデル候補の一つとなっており、以下の図を見ても分かるようにYOLO,SSD,Refine-Net等と比較しても同程度の速度を保ちつつ、精度が上がっていることがわかります。 ※https:
お問い合わせはこちらから