AWS Lambda 料金体系・コールドスタート・同期 / 非同期・エラーハンドリング... 調べたことまとめ

参照

背景

Slack での対話を Supabase（PostgreSQL + pgvector）に蓄積し、将来のファインチューニングや RAG に使える形式で保存するプロジェクトで Lambda 関数を組み込んだ時に調べた内容。

料金体系

Lambdaの料金は、処理時間とリクエスト回数によって算出される。処理時間が大きくなるほどコストは安くなるが、リクエスト回数による料金は増減せず一定。

また、リージョン・為替・改定で請求額が変わる。下記は 2026 年 3 月 22 日の情報で、最新は AWS Lambda 料金 を参照。

課金の仕組み: 呼び出し回数 + メモリ × 実行時間（GB秒）

リクエスト単価・期間単価

アーキテクチャ: x86 (デフォルト)
リージョン: アジアパシフィック

アーキテクチャ	時間	GB秒あたり（USD）	リクエスト 100万件あたり（USD）
x86	最初の 60 億 GB秒/月	0.0000166667	0.20
x86	次の 90 億 GB秒/月	0.000015	0.20
x86	150 億 GB秒/月以上	0.0000133334	0.20
Arm	最初の 75 億 GB秒/月	0.0000133334	0.20
Arm	次の 112.5 億 GB秒/月	0.0000120001	0.20
Arm	187 億 5 千万 GB秒/月以上	0.0000106667	0.20

メモリ単価

メモリ (MB)	1 ミリ秒あたりの料金
128	USD 0.0000000021
512	USD 0.0000000083
1,024	USD 0.0000000167
1,536	USD 0.0000000250
2,048	USD 0.0000000333
3,072	USD 0.0000000500
4,096	USD 0.0000000667
5,120	USD 0.0000000833
6,144	USD 0.0000001000
7,168	USD 0.0000001167
8,192	USD 0.0000001333
9,216	USD 0.0000001500
10,240	USD 0.0000001667

見積方法

Cloud Watch でログを見ることで使用メモリを確認できる。

REPORT RequestId: 217b229e-b6e4-48b3-9879-e2a3ee04b5ff	Duration: 7.29 ms	Billed Duration: 8 ms	Memory Size: 256 MB	Max Memory Used: 107 MB

コスト削減のための運用方法としては、 Max Memory Used をもとに、次のメモリ上限にサイズ更新するなどしてアッパーを定めると良い。

これにより OOM (Out Of Memory) を避けて安定性を保ちつつ、コスト削減をすることができる。

コールドスタート

概要

Lambda の使用したアプリケーションにおいては、コールドスタート問題を考える必要がある。特に、応答時間が重要なアプリケーションではこの問題を無視することはできない。

コールドスタートは、Lambdaの実行環境が更新される下記のタイミングで発生する。

新しい Lambda 関数が最初に実行されるとき
長時間使用されなかったLambdaが実行されるとき

この時、AWSは以下の手順を踏む必要がある。

実行環境（コンテナ）の準備
ランタイムの初期化
Lambda関数コードのロード

これらのプロセスは時間を要するため、リクエスト処理の遅延に繋がる。
これが コールドスタート と呼ばれる現象。

対策

軽量なランタイムを選択する
- Node.js や Python など、初期化が比較的速いランタイムを選ぶことで、コールドスタートの時間を短縮できる。
Provisioned Concurrencyを利用する
- AWSは Lambda のインスタンスを事前に起動しておく Provisioned Concurrency という機能を提供している。予測可能なトラフィックの増加時や、応答速度が特に重要なシステムで役立つ。

今回のプロジェクトでは応答速度は問題にならなかったので、特に対策はしていない。

Lambda の同期処理・非同期処理

同期実行
- 呼び出し元がLambda関数の処理結果を待ち、レスポンスを受け取る
- API Gatewayを通じてHTTPリクエストに応答する場合など、リアルタイムでの応答が必要なシナリオで主に使用される
非同期実行
- 呼び出し元はリクエストを送信後、Lambda関数の処理結果を待たずに後続処理を実行する
  - Lambdaはイベントを内部キューに置き、非同期に処理する
- S3イベントによる画像処理や、データのバッチ処理など、即時のレスポンスが必要でないシナリオに適している

Lambda の実行方式 (同期・非同期) はトリガーとなるサービスによって異なる。

非同期処理

Lambda の 内部キュー とは、非同期実行を実現するためにイベントを一時的に保持するための箱のようなものを指す。

LambdaのキューはSQSのようにユーザーが直接利用できるようなものではなく、Lambdaのサービスに組み込まれた内部的なキューのため、開発者がアクセスしたり、管理したりすることはない。

例えば S3 にデータがアップロードされたのをトリガーに Lambda 関数が実行されるユースケースを考える。

イベントのトリガー
- S3にデータがアップロードされると、それがトリガーになりこのイベント情報がLambdaに送信される
内部キューへの配置
- Lambdaは受け取ったイベントを内部キューに配置する
- 内部キューはイベントを処理するためのリソースが利用可能になるまでの一時的な保管場所として機能する
イベントの処理
- キューに入ったイベントは、Lambdaによって順次取り出され、関連付けられたLambda関数で処理される

エラーハンドリング

Lambdaで発生するエラーは、大きく分けて下記の二つに分類される。

Lambda 関数呼び出し時のエラー
Lambda 関数実行時のエラー

関数呼び出し時のエラー

リクエストデータの検証
- Lambda 関数を呼び出す前にリクエストデータのバリデーションチェックなどを行い、データに不備がある場合はそもそもLambda関数を呼び出さないように
アクセス権限の確認
- 呼び出しを行う前に、適切なアクセス権限（ API 呼び出しの場合はアクセスキーとシークレットキー、 AWS サービスからの呼び出しの場合は IAM ロール）が設定されていることを確認するように
同時実行数の管理
- Lambda 関数の同時実行数が上限に達しそうな場合は、 AWS に上限緩和の申請をするか、一定間隔を空けたのちに再試行するように

関数実行時のエラー

関数のコードによって生み出された例外
ランタイムの終了

→ Node.js の場合はこちらを参照

＜API で直接 Lambda 関数を実行させた場合＞
関数からのエラーレスポンスは直接APIの呼び出し元に返される。エラーハンドリングが比較的容易なため、レスポンス内容に応じてログ出力やリトライ処理などを行う必要がある。

関数実行時のエラーは 400 番台または 500 番台が返却されない。すなわち、Lambda関数の実行は失敗しているもののステータスコードでは 200 番台が返却されることがあるため、「ステータスコードが 200 番台だった場合は正常レスポンスとみなし後続処理を続ける」といった実装をしてしまうと、実際にはエラーが起きていたとしてもそのエラーに永遠と気付けない。

＜AWS サービスのイベントをトリガーに Lambda 関数を実行させた場合＞
関数実行時のエラーは直接トリガー元には通知されないため、エラーを正確にキャッチするためには工夫が必要。(CloudWatch Logs のみ自動で実行ログが送られる)

リトライ

＜Lambda 関数を直接 API で呼び出した場合のリトライ処理＞
リトライ処理は Lambda 側ではされず、呼び出し元でレスポンスに応じてログを出したりリトライしたりする必要がある。

＜イベントをトリガーに Lambda 関数が実行された場合のリトライ処理＞
非同期処理の場合は Lambda がリトライ処理を2回まで実行してくれる。

Lambdaが自動的にリトライしてくれるエラーはあくまで再試行によって解決可能なエラーのみ。

Lambda関数の実行タイムアウト

Lambdaサービスが一時的に高い負荷によりリクエストを処理できない場合

Lambda関数がトリガーされたが必要なリソースが一時的に利用できない場合
etc...

詳細

1回目と2回目の試行 → 1分間の待機時間
2回目と3回目の試行 → 2分間の待機時間
同時実行数に空きがない場合 → スロットリングされる