WebSocket Streaming

WSS The WebSocket endpoint provides real-time bidirectional communication for streaming text-to-speech generation. This is ideal for applications requiring low-latency audio streaming.

Endpoint

WSS /text-to-speech

Connection

Connect to the WebSocket endpoint:

wss://api.faseeh.com/api/v1/text-to-speech?x-api-key=YOUR_API_KEY

Or include the API key in the x-api-key header during the WebSocket handshake.

Authentication

Requires API key authentication. Authentication can be provided via:

Query parameter: ?x-api-key=YOUR_API_KEY
Header: x-api-key: YOUR_API_KEY
In initConnection message: x_api_key field

Request

Query Parameters

Parameter	Type	Required	Description
`x-api-key`	string	No*	API key for authentication (alternative to header)

* Required if not provided via header or in initConnection message

Headers

Header	Type	Required	Description
`x-api-key`	string	No*	API key for authentication

* Required if not provided via query parameter or in initConnection message

InitConnection Message Parameters

Field	Type	Required	Description
`type`	string	Yes	Must be `"initConnection"`
`model_id`	string	Yes	The model identifier to use for generation
`voice_id`	string	Yes	The voice ID to use for synthesis
`voice_settings`	object	No	Voice settings object
`voice_settings.stability`	number	No	Voice stability (0.0 to 1.0). Higher values produce more consistent output. Default: 0.5
`x_api_key`	string	No*	API key for authentication (alternative to query/header)

* Required if not provided via query parameter or header

Text Message Parameters

Field	Type	Required	Description
`type`	string	Yes	Must be `"text"`
`text`	string	Yes	The Arabic text to append to the buffer
`try_trigger_generation`	boolean	Yes	If `true`, triggers generation immediately after appending text

CloseConnection Message Parameters

Field	Type	Required	Description
`type`	string	Yes	Must be `"closeConnection"`

Example InitConnection Request

{
  "type": "initConnection",
  "model_id": "MODEL_ID",
  "voice_id": "VOICE_ID",
  "voice_settings": {
    "stability": 0.5
  }
}

Example Text Request

{
  "type": "text",
  "text": "مرحبا بك في فصيح كيف يمكنني مساعدتك اليوم",
  "try_trigger_generation": true
}

Example CloseConnection Request

{
  "type": "closeConnection"
}

Message Types

Initialize Connection

Initialize the WebSocket connection with model and voice settings. Message:

{
  "type": "initConnection",
  "model_id": "MODEL_ID",
  "voice_id": "VOICE_ID",
  "voice_settings": {
    "stability": 0.5
  }
}

Alternative format (legacy):

{
  "voice_id": "VOICE_ID",
  "model_id": "MODEL_ID",
  "stability": 0.5
}

Response:

{
  "type": "connectionInitialized"
}

Send Text

Send text for generation. Text is buffered until generation is triggered. Message:

{
  "type": "text",
  "text": "مرحبا بك في فصيح كيف يمكنني مساعدتك اليوم",
  "try_trigger_generation": true
}

Parameters:

text (string): The text to append to the buffer
try_trigger_generation (boolean): If true, triggers generation immediately after appending text

Close Connection

Gracefully close the WebSocket connection. Message:

{
  "type": "closeConnection"
}

Response Types

Audio Chunk

Streaming audio data as base64-encoded PCM16 chunks.

{
  "audio": "base64_encoded_audio_data",
  "sampleRate": 24000,
  "isFinal": false
}

Final Chunk

Indicates the end of audio generation.

{
  "audio": "",
  "sampleRate": 24000,
  "isFinal": true
}

Error

Error response with descriptive message.

{
  "type": "error",
  "message": "Error description"
}

Example Usage

JavaScript

const ws = new WebSocket('wss://api.faseeh.com/api/v1/text-to-speech?x-api-key=YOUR_API_KEY');

ws.onopen = () => {
  console.log('WebSocket connected');
  
  // Initialize connection
  ws.send(JSON.stringify({
    type: 'initConnection',
    model_id: 'MODEL_ID',
    voice_id: 'VOICE_ID',
    voice_settings: {
      stability: 0.5
    }
  }));
};

ws.onmessage = (event) => {
  const data = JSON.parse(event.data);
  
  if (data.type === 'connectionInitialized') {
    console.log('Connection initialized');
    
    // Send text for generation
    ws.send(JSON.stringify({
      type: 'text',
      text: 'مرحبا بك في فصيح كيف يمكنني مساعدتك اليوم',
      try_trigger_generation: true
    }));
  } else if (data.audio) {
    if (data.isFinal) {
      console.log('Generation complete');
    } else {
      // Decode base64 audio
      const audioData = atob(data.audio);
      const audioBuffer = new Uint8Array(audioData.length);
      for (let i = 0; i < audioData.length; i++) {
        audioBuffer[i] = audioData.charCodeAt(i);
      }
      
      // Process audio chunk (e.g., play or save)
      processAudioChunk(audioBuffer, data.sampleRate);
    }
  } else if (data.type === 'error') {
    console.error('Error:', data.message);
  }
};

ws.onerror = (error) => {
  console.error('WebSocket error:', error);
};

ws.onclose = () => {
  console.log('WebSocket closed');
};

Python

import asyncio
import websockets
import json
import base64

async def generate_speech():
    uri = "wss://api.faseeh.com/api/v1/text-to-speech?x-api-key=YOUR_API_KEY"
    
    async with websockets.connect(uri) as websocket:
        # Initialize connection
        await websocket.send(json.dumps({
            "type": "initConnection",
            "model_id": "MODEL_ID",
            "voice_id": "VOICE_ID",
            "voice_settings": {
                "stability": 0.5
            }
        }))
        
        # Wait for initialization confirmation
        response = await websocket.recv()
        data = json.loads(response)
        
        if data.get("type") == "connectionInitialized":
            # Send text for generation
            await websocket.send(json.dumps({
                "type": "text",
                "text": "مرحبا بك في فصيح كيف يمكنني مساعدتك اليوم",
                "try_trigger_generation": True
            }))
            
            # Receive audio chunks
            audio_chunks = []
            while True:
                response = await websocket.recv()
                data = json.loads(response)
                
                if data.get("type") == "error":
                    print(f"Error: {data['message']}")
                    break
                elif data.get("audio") is not None:
                    if data.get("isFinal"):
                        break
                    else:
                        # Decode base64 audio
                        audio_data = base64.b64decode(data["audio"])
                        audio_chunks.append(audio_data)
                        print(f"Received audio chunk: {len(audio_data)} bytes")
            
            # Combine all chunks
            complete_audio = b''.join(audio_chunks)
            return complete_audio

# Run the async function
audio = asyncio.run(generate_speech())

Best Practices

Initialize First: Always send initConnection before sending text
Handle Errors: Implement error handling for all error message types
Buffer Management: Text is buffered until try_trigger_generation is true
Connection Lifecycle: Close connections gracefully using closeConnection
Reconnection: Implement reconnection logic for production applications

Cost Calculation

Cost is calculated and deducted from your wallet balance when generation completes successfully. The cost is based on:

Text length (number of characters)
Model cost per character

Wallet Balance: Ensure your wallet has sufficient balance. Insufficient balance will result in an error message. Check your balance in the Faseeh dashboard.

API documentation

Models

Text-to-speech

Endpoint

Connection

Authentication

Request

Query Parameters

Headers

InitConnection Message Parameters

Text Message Parameters

CloseConnection Message Parameters

Example InitConnection Request

Example Text Request

Example CloseConnection Request

Message Types

Initialize Connection

Send Text

Close Connection

Response Types

Audio Chunk

Final Chunk

Error

Example Usage

JavaScript

Python

Best Practices

Cost Calculation

API documentation

Models

Text-to-speech

​Endpoint

​Connection

​Authentication

​Request

​Query Parameters

​Headers

​InitConnection Message Parameters

​Text Message Parameters

​CloseConnection Message Parameters

​Example InitConnection Request

​Example Text Request

​Example CloseConnection Request

​Message Types

​Initialize Connection

​Send Text

​Close Connection

​Response Types

​Audio Chunk

​Final Chunk

​Error

​Example Usage

​JavaScript

​Python

​Best Practices

​Cost Calculation

Endpoint

Connection

Authentication

Request

Query Parameters

Headers

InitConnection Message Parameters

Text Message Parameters

CloseConnection Message Parameters

Example InitConnection Request

Example Text Request

Example CloseConnection Request

Message Types

Initialize Connection

Send Text

Close Connection

Response Types

Audio Chunk

Final Chunk

Error

Example Usage

JavaScript

Python

Best Practices

Cost Calculation