タグ

MFCCに関するrin51のブックマーク (8)

  • MFCC(メル周波数ケプストラム係数)入門 - Qiita

    MFCCとは MFCCは聴覚フィルタに基づく音響分析手法で、主に音声認識の分野で使われることが多いです。 最近だとニューラルネットワークに学習させる音声特徴量としてよく使われていますね。 2019.5.29訂正 Deep Learning for Audio Signal ProcessingによるとDeep Learningにおいては必要な情報が失われるためMFCCは使わずに、最後の計算ステップである離散コサイン変換を省いたメルスペクトラム(log-mel spectrum)が使われるそうです。MFCCは従来手法である隠れマルコフモデル、混合ガウスモデル、サポートベクターマシンで使われることが多いです。 今回はMFCC「メル周波数」や「ケプストラム」についても説明し、具体的なMFCCの実装方法も見ていきたいと思います。 メル尺度 心理学者のStanley Smith Stevensらによ

    MFCC(メル周波数ケプストラム係数)入門 - Qiita
  • メル周波数ケプストラム係数(MFCC) - 人工知能に関する断創録

    Pythonで音声信号処理(2011/05/14)の第19回目。 今回は、音声認識の特徴量としてよく見かけるメル周波数ケプストラム係数(Mel-Frequency Cepstrum Coefficients)を求めてみました。いわゆるMFCCです。 MFCCはケプストラム(2012/2/11)と同じく声道特性を表す特徴量です。ケプストラムとMFCCの違いはMFCCが人間の音声知覚の特徴を考慮していることです。メルという言葉がそれを表しています。 MFCCの抽出手順をまとめると プリエンファシスフィルタで波形の高域成分を強調する 窓関数をかけた後にFFTして振幅スペクトルを求める 振幅スペクトルにメルフィルタバンクをかけて圧縮する 上記の圧縮した数値列を信号とみなして離散コサイン変換する 得られたケプストラムの低次成分がMFCC となります。私が参考にしたコードは振幅スペクトルを使ってたけど

    メル周波数ケプストラム係数(MFCC) - 人工知能に関する断創録
  • 音楽と機械学習 前処理編 MFCC ~ メル周波数ケプストラム係数 - Qiita

    最近音楽機械学習で扱うことに興味があって色々と調べているのですが、せっかくなので備忘録と理解促進を兼ねて記事にしてみます。 機械学習に限らず、音楽をデジタル情報として扱う際には楽譜や調、歌詞など、メタな情報を扱う方法と、オーディオデータそのものを扱う方法とに大別されますが、今回はオーディオデータそのものを扱う方法の一つとして、MFCCについてまとめます。 お急ぎの方向け mp3 を wav にして MFCC して現実的に扱えそうな次元に落とす # ffmpegのインストール $ brew install ffmpeg # ffmpegmp3 を サンプリングレート 44.1kHz wavに変換 $ ffmpeg -i hoge.mp3 -ar 44100 hoge.wav # 必要なPythonパッケージのインストール $ pip install --upgrade sklearn

    音楽と機械学習 前処理編 MFCC ~ メル周波数ケプストラム係数 - Qiita
  • 深層学習を使って楽曲のアーティスト分類をやってみた! - Platinum Data Blog by BrainPad

    深層学習を使った音声データによる楽曲分類を実施しました!楽曲の特徴を表すメル周波数スペクトログラムを用いて、その楽曲のアーティストを推定します。 こんにちは、アナリティクスサービス部の井出です。 今回のブログは、音声データをテーマとして取り上げ、 音声データの特徴量 深層学習による楽曲のアーティスト分類 についてご紹介します。 ブレインパッドでは、深層学習の技術を駆使した活用事例が増えてきています。特に、画像認識の分野における活用事例は多く、当社の公開されている事例だけでも以下のようなものがあります。 ブレインパッド、キユーピーの品工場における不良品の検知をディープラーニングによる画像解析で支援 八千代エンジニヤリングとブレインパッド、洪水を安全に流す役割を担う河川のコンクリート護岸の劣化をAIで自動判定するサービス「GoganGo」を共同開発 一方で、音声データを扱う事例はなかなか珍

    深層学習を使って楽曲のアーティスト分類をやってみた! - Platinum Data Blog by BrainPad
  • http://abcpedia.acoustics.jp/bs13_q4.pdf

  • 「音響学入門ぺディア」Q&A集の紹介 Q4:音響特徴量ってなんですか??

    「音響学入門ぺディア」Q&A集の紹介 Q4:音響特徴量ってなんですか?? 森川 大輔 北陸先端科学技術大学院大学 学生・若手フォーラム幹事会 音響特徴量ってなんですか?? 音の物理的な特徴や特性 音響特徴量 音に含まれる物理的な特徴を数値化したもの *特徴量だけでなく、 特徴そのものや、特性まで含むこともある 要は・・・ (が多い) MKS単位系で表現可能 (m kg s) 物理的とは?? 人が音を評価 感覚量or心理量→主観 音の高さ 音の大きさ 音色 基周波数 音の周期 音の強さ、音圧 スペクトル分布 時間パターン 物理的に音を評価 物理量→客観 ※今回の話しは物理量 音響学入門ぺディアQ&A集 主観評価に興味がある人 「主観評価がわかりません」 数 値 で 表 現 可 能 !! いろいろな音響特徴量 零交差数 RMS パワー 相関係数 平均 分散 高次統計量 歪み率 基周波数 継

  • Q 様々な音響特徴量 それぞれの使い方や意味を教えて下さい

    様々な音響特徴量 それぞれの使い方や意味を教えて下さい Q. 東北大学 大学院 工学研究科 博士後期課程2年 千葉 祐弥 音響学入門ペディア マスター タイトルの書式設定 特徴量って何に使うもの? より無駄が少なく、データの質をあらわした表現が欲しい! ⇒ データからなるべく良い特徴量を抽出する必要がある  収録条件、個人差、データ差などの違いが大きくて質的な部分がわかりにくい  データ量や計算量が多くて取り扱いにくい 生のデータそのものを利用するのは無理がある 2 • 統計的分析 • 機械学習、パターン認識 • 音声認識、音声インターフェースの作成 • 楽曲のジャンル推定、楽曲検索、推薦等への応用 など • 人間が音を聞く仕組みを解明する(方向、高さ、大きさ、音色・・・の知覚) • データの符号化、圧縮への応用 など マスター タイトルの書式設定 特徴量の選び方 音素の判別に有効

  • 類似楽曲検索システムを作ろう - 人工知能に関する断創録

    もう1年以上かけて音声信号処理の勉強をしてきました(Pythonで音声信号処理)。ここらで具体的なアプリケーションとして類似楽曲検索の実験をしてみたのでレポートをまとめておきます。言語はPythonです。 前に 類似画像検索システムを作ろう(2009/10/3) Visual Wordsを用いた類似画像検索(2010/2/27) という画像の類似検索に関するエントリを書きましたが、今回は画像ではなく音楽を対象に類似検索をやってみたいと思います! 今回作る類似楽曲検索システムは、従来からよくあるアーティスト名や曲名などテキストで検索するシステムや購買履歴をもとにオススメする協調フィルタリングベースのシステムとは異なります。WAVEファイルやMP3ファイルなどの音楽波形そのものを入力とするのが特徴です。たとえば、「具体的なアーティストや曲名は知らないけれど、この曲とメロディや雰囲気が似た曲がほ

    類似楽曲検索システムを作ろう - 人工知能に関する断創録
  • 1