AI
2024.03.21
OpenAIが提供する音声認識オープンソースWhisperとは(4)
whisperのデバッグ環境構築whisperのソースコードをチェックアウトするgit clone https://github.com/openai/whisper.gitcd whispertest.pyの作成import sysfrom whisper.transcribe import cliif __name__ == '__main__': sys.exit(cli())test.pyの実行python test.py sample.mp4 --language Englishtranscribe.pydef cli():・・・ model = load_model(model_name, device=device, download_root=model_dir)・・・ソースを確認するload_model関数を読むデフォルト時の引数は、model_name=small, device=cpu, download_root=Noneが使用さ
AI
2024.03.18
OpenAIが提供する音声認識オープンソースWhisperとは(3)
transcribe関数の確認def transcribe( model: "Whisper", audio: Union, *, verbose: Optional = None, temperature: Union = (0.0, 0.2, 0.4, 0.6, 0.8, 1.0), compression_ratio_threshold: Optional = 2.4, logprob_threshold: Optional = -1.0, no_speech_threshold: Optional = 0.6, condition_on_previous_text: bool = True, initial_prompt: Optional = None, word_timestamps: bool = False, prepend_punctuations: str = "\"'“¿([{-", appen
AI
2024.03.17
OpenAIが提供する音声認識オープンソースWhisperとは(2)
whisperコマンド実行時のエントリーポイントの確認whisperはpipでインストールする設計なので、whisperのsetup.pyファイル内のentry_pointsを確認する。コマンドラインからwhisperコマンドを実行すると、whisper.transcribe:cliが呼び出されることが確認できる。setup(・・・ entry_points={ "console_scripts": , },・・・)エントリポイント whisper.transcribe:cli のコード確認def cli(): from . import available_models def valid_model_name(name): if name in available_models() or os.path.exists(name): return name raise ValueError(
AI
2024.03.17
OpenAIが提供する音声認識オープンソースWhisperとは(1)
whisperとは?Whisperは汎用音声認識モデルです。多様なオーディオの大規模なデータセットで訓練されており、マルチタスクモデルでもあり、多言語音声認識、音声翻訳、言語識別などの機能を実行できます。ChatGPTで有名なOpenAIがMITライセンスの下にオープンソースとして公開しています。「Whisperアーキテクチャは、エンコーダーデコーダーTransformerとして実装されたシンプルなエンドツーエンドのアプローチです。入力オーディオは30秒のチャンクに分割され、対数メルスペクトログラムに変換され、それからエンコーダーに渡されます。デコーダーは、特殊トークンと組み合わされた対応するテキストキャプションを予測するようにトレーニングされ、この特殊トークンは、単一モデルが言語識別、フレーズレベルのタイムスタンプ、多言語音声の転記、および英語への音声翻訳などのタスクを実行するように導きます。他の既存のアプローチは、より小規模で、より密にペアされた音声テキストのトレーニングデータセットを使用したり、広範囲ながら非監視の音声事前トレーニングを使用したりすること
Apple
2024.02.29
HealthKitアプリSwiftコードの紹介(4) – HealthKitデータの管理
HealthKitデータの管理と同期を行うためのクラスこのコードは、HealthKitデータの管理と同期を行うためのクラス HealthKitStore とそれに関連するプロトコル HealthKitStoreProtocol を定義しています。このクラスは、HealthKitフレームワークを使用してユーザーのヘルスデータを読み取り、アップロードするための機能を提供します。import Foundationimport HealthKitimport UIKitimport Combineprotocol HealthKitStoreProtocol { func authorizeHealthKit(completion: @escaping () -> Void) func startObservingDataChanges(queue: DispatchQueue?, isBackgroundTask: Bool, completion: @escaping () -> Void) func updateCharac
Apple
2024.02.29
HealthKitアプリSwiftコードの紹介(3) – HealthKitデータの監視
HealthKitの心電図データと数量データの監視次のstartObservingDataChangesメソッドは、健康データの変更を監視し、データをサーバーにアップロードするための非同期処理を開始するためのものです。このメソッドは、指定されたクロージャーの完了時に呼び出される非同期タスクを開始します。シーケンス図以下に、本投稿で説明する部分のシーケンス図を示します。まず、self.queue.asyncを使用して、データ処理を非同期で実行するためにディスパッチキューに渡します。これにより、メソッドの呼び出し元のスレッドがブロックされることなく、バックグラウンドで処理が行われます。その後、HealthKitStore.healthKitActivityTypeの各サンプルタイプに対して、処理を開始します。サンプルタイプごとに、最新の健康データサンプルを取得し、データを適切な形式に変換して処理します。例えば、心電図の場合はECGUploadDataModelに変換し、その他の健康データの場合はHealthKitQualityUploadD
Apple
2024.02.29
HealthKitアプリSwiftコードの紹介(2) – バックグラウンドタスクサービスの実装
バックグラウンドタスクサービスの実装このコードは、バックグラウンドでHealthKitからヘルスデータを読み出すためのサービスを実装しています。BackgroundTaskServiceProtocolプロトコルを定義し、バックグラウンドタスクの登録や処理、データの取得などのメソッドを宣言しています。バックグラウンドでHealthKitからヘルスデータを読み出すSwiftコードの紹介(1)と同じ以下のシーケンス図を用いて説明していきます。BackgroundTaskServiceクラスは、BackgroundTaskServiceProtocolプロトコルを採用し、実装しています。このクラスは、ユーザーのデフォルト設定、Auth0サービス、データ同期API、ローカルデータベースなどの依存性を受け取ります。また、バックグラウンドで実行されるタスクの管理や、HealthKitからのデータ取得などを行います。import BackgroundTasksimport UserNotificationsimport HealthKitprotoc
Apple
2024.02.28
HealthKitアプリSwiftコードの紹介(1) – DIコンテナへのサービス登録
はじめにこの投稿では、現在Swiftで開発中のiPhoneアプリの設計やコードの一部を紹介していきます。このアプリは、Apple WatchやiPhoneでHealthKitのデータベースに保存されたヘルスデータをサーバーに送信することが主な目的です。アプリがバックグラウンド中でも定期的にデータを送信することを目標にしています。また、アプリ上で簡単なグラフの確認もできるように実装しています。シーケンス図今回説明する部分のクラスの関係がわかりやすいようにシーケンス図を記載しました。シングルトンとしてのコンテナの実装このコードは、SwiftのDIコンテナライブラリであるSwinjectを使用して依存性注入を行うためのコンテナを定義しています。まず、Containerのインスタンスを生成し、Assemblerを使用してそのコンテナに複数のアセンブリを適用します。各アセンブリは、特定の機能や機能グループの依存関係を登録します。例えば、RepositoryAssemblyはリポジトリの依存関係を、MainNaviAssemblyはメインナビゲーシ
お知らせ
2024.02.8
社名変更ならびに本社移転のお知らせ
2024/02/05付で、社名と本店所在地を以下に変更いたしました。株式会社S3LAB371-0835 群馬県前橋市前箱田町387-1TM Office x 3Happy前橋というシェアオフィス内の個室を本社として使用することにしました。このシェアオフィスは2023/02/20にオープンしたばかりで、すべての設備が新しく、快適に仕事できる環境が整っています。高崎駅から車で20分くらいのところに位置しています。
株主総会
2024.02.8
第7回定期株主総会を開催しました。
本株主総会では、事業報告、各議案の説明、審議のあと、採決を行いました。全ての議案が承認可決され、無事に終了することができました。開催日時2024年02月01日 午前10時開催場所本社