Add missing audio formats for OpenAIAudio API

gabriel duncan · ilayaperumalg · commit 64a4f79783de · 2025-04-01T10:27:26.000+01:00
- Add missing formats "wav" and "pcm" which OpenAI supports but SpringAI does not have serializers for

Signed-off-by: gabriel duncan &lt;gabrielduncan@Mac.attlocal.net&gt;
diff --git a/models/spring-ai-openai/src/main/java/org/springframework/ai/openai/api/OpenAiAudioApi.java b/models/spring-ai-openai/src/main/java/org/springframework/ai/openai/api/OpenAiAudioApi.java
@@ -378,8 +378,8 @@ public String getValue() {
 		}
 
 		/**
-		 * The format to audio in. Supported formats are mp3, opus, aac, and flac.
-		 * Defaults to mp3.
+		 * The format to audio in. Supported formats are mp3, opus, aac, wav, pcm and
+		 * flac. Defaults to mp3.
 		 */
 		public enum AudioResponseFormat {
 
@@ -391,7 +391,11 @@ public enum AudioResponseFormat {
 			@JsonProperty("aac")
 			AAC("aac"),
 			@JsonProperty("flac")
-			FLAC("flac");
+			FLAC("flac"),
+			@JsonProperty("wav")
+			WAV("wav"),
+			@JsonProperty("pcm")
+			PCM("pcm");
 			// @formatter:on
 
 			public final String value;
diff --git a/models/spring-ai-openai/src/test/java/org/springframework/ai/openai/audio/speech/OpenAiSpeechModelIT.java b/models/spring-ai-openai/src/test/java/org/springframework/ai/openai/audio/speech/OpenAiSpeechModelIT.java
@@ -72,6 +72,24 @@ void shouldGenerateNonEmptyMp3AudioFromSpeechPrompt() {
 
 	}
 
+	@Test
+	void shouldGenerateNonEmptyWavAudioFromSpeechPrompt() {
+		OpenAiAudioSpeechOptions speechOptions = OpenAiAudioSpeechOptions.builder()
+			.voice(OpenAiAudioApi.SpeechRequest.Voice.ALLOY)
+			.speed(SPEED)
+			.responseFormat(OpenAiAudioApi.SpeechRequest.AudioResponseFormat.WAV)
+			.model(OpenAiAudioApi.TtsModel.TTS_1.value)
+			.build();
+		SpeechPrompt speechPrompt = new SpeechPrompt("Today is a wonderful day to build something people love!",
+				speechOptions);
+		SpeechResponse response = this.speechModel.call(speechPrompt);
+		byte[] audioBytes = response.getResult().getOutput();
+		assertThat(response.getResults()).hasSize(1);
+		assertThat(response.getResults().get(0).getOutput()).isNotEmpty();
+		assertThat(audioBytes).hasSizeGreaterThan(0);
+
+	}
+
 	@Test
 	void speechRateLimitTest() {
 		OpenAiAudioSpeechOptions speechOptions = OpenAiAudioSpeechOptions.builder()