Name: OpenEnv Environments
Author: deepraj21

搜索技能.../

OpenEnv Environments | Skills Pool

while not done:
    observation = environment.observe()
    action = policy.choose(observation)
    reward = environment.step(action)
    policy.learn(reward)

src/envs/your_env/
├── models.py          ← Type-safe contracts (Action, Observation, State)
├── client.py          ← What your training code imports (HTTPEnvClient)
└── server/
    ├── environment.py ← Game/simulation logic (implements Environment ABC)
    ├── app.py         ← FastAPI server (auto-created via create_fastapi_app)
    └── Dockerfile     ← Container definition

from core.env_server import Environment, Action, Observation, State

class MyEnvironment(Environment):
    @abstractmethod
    def reset(self) -> Observation:
        """Start new episode"""

    @abstractmethod
    def step(self, action: Action) -> Observation:
        """Execute action, return observation"""

    @property
    def state(self) -> State:
        """Get episode metadata"""

from core.http_env_client import HTTPEnvClient

class MyEnv(HTTPEnvClient[MyAction, MyObservation]):
    def _step_payload(self, action: MyAction) -> dict:
        return {"action_value": action.action_value}

    def _parse_result(self, payload: dict) -> StepResult:
        return StepResult(
            observation=MyObservation(...),
            reward=payload['reward'],
            done=payload['done']
        )

    def _parse_state(self, payload: dict) -> MyState:
        return MyState(...)

from envs.openspiel_env import OpenSpielEnv
from envs.openspiel_env.models import OpenSpielAction, OpenSpielObservation

env = OpenSpielEnv(base_url="http://localhost:8000")

result = env.reset()
# Returns StepResult[OpenSpielObservation] — fully typed

result = env.step(OpenSpielAction(action_id=2, game_name="catch"))
# Type checker validates this is correct

state = env.state()
# Returns OpenSpielState with episode metadata

# Start tic-tac-toe instead of catch
OPENSPIEL_GAME=tic_tac_toe uvicorn envs.openspiel_env.server.app:app ...

from dataclasses import dataclass
from core.env_server import Action, Observation, State

@dataclass
class YourAction(Action):
    action_value: int

@dataclass
class YourObservation(Observation):
    state_data: List[float]
    done: bool
    reward: float

@dataclass
class YourState(State):
    episode_id: str
    step_count: int

from core.env_server import Environment

class YourEnvironment(Environment):
    def reset(self) -> YourObservation:
        # Initialize game state
        return YourObservation(...)

    def step(self, action: YourAction) -> YourObservation:
        # Execute action, compute reward
        return YourObservation(...)

    @property
    def state(self) -> YourState:
        return self._state

from core.http_env_client import HTTPEnvClient

class YourEnv(HTTPEnvClient[YourAction, YourObservation]):
    def _step_payload(self, action: YourAction) -> dict:
        return {"action_value": action.action_value}

    def _parse_result(self, payload: dict) -> StepResult:
        return StepResult(
            observation=YourObservation(...),
            reward=payload['reward'],
            done=payload['done']
        )

from core.env_server import create_fastapi_app
from .your_environment import YourEnvironment

env = YourEnvironment()
app = create_fastapi_app(env)  # OpenEnv creates all endpoints automatically

FROM python:3.11-slim
WORKDIR /app
COPY requirements.txt .
RUN pip install --no-cache-dir -r requirements.txt
COPY . .
CMD ["uvicorn", "app:app", "--host", "0.0.0.0", "--port", "8000"]

┌────────────────────────────────────────────────────────────┐
│  YOUR TRAINING CODE                                        │
│  env = OpenSpielEnv(...)     ← Import the client          │
│  result = env.reset()        ← Type-safe!                 │
│  result = env.step(action)   ← Type-safe!                 │
└─────────────────┬──────────────────────────────────────────┘
                  │  HTTP/JSON  POST /reset, POST /step, GET /state
┌─────────────────▼──────────────────────────────────────────┐
│  DOCKER CONTAINER                                          │
│  FastAPI Server                                            │
│  └─ Environment (reset, step, state)                       │
│     └─ Your Game/Simulation Logic                          │
│  Isolated • Reproducible • Secure                          │
└────────────────────────────────────────────────────────────┘

Challenge	Traditional (Gym)	OpenEnv
Type Safety	`obs[0][3]` — unclear	`obs.info_state` — IDE-friendly
Isolation	Same process (crash risk)	Docker containers
Deployment	"Works on my machine"	Same container everywhere
Scaling	Hard to distribute	Kubernetes-ready
Language	Python only	Any language via HTTP

Challenge	Traditional (Gym)	OpenEnv
Type Safety	`obs[0][3]` — unclear	`obs.info_state` — IDE-friendly
Isolation	Same process (crash risk)	Docker containers
Deployment	"Works on my machine"	Same container everywhere
Scaling	Hard to distribute	Kubernetes-ready
Language	Python only	Any language via HTTP

Single-Player	Multi-Player
Catch	Tic-Tac-Toe
Cliff Walking	Kuhn Poker
2048
Blackjack

OpenEnv Environments

Why OpenEnv Over Traditional Gym?

The Core RL Loop

OpenEnv Environments

Why OpenEnv Over Traditional Gym?

The Core RL Loop

The 3-Component Pattern

Server Side (runs in Docker)

Client Side (your training code)

OpenSpiel Integration

Using OpenSpiel Environments

OpenSpielObservation Fields

Switching Games

Creating a Custom Integration (5 Steps)

Step 1: Define Types (`models.py`)

Step 2: Implement Server Environment (`server/environment.py`)

Step 3: Create HTTP Client (`client.py`)

Step 4: Register the Server (`server/app.py`)

Step 5: Dockerize (`server/Dockerfile`)

Reference Examples in the Repo

Architecture Diagram

Resources

Prose

Golang Patterns

Audiocraft Audio Generation

Pokemon Player

Ideation

Storybook Upgrade

OpenEnv Environments

Why OpenEnv Over Traditional Gym?

The Core RL Loop

OpenEnv Environments

Why OpenEnv Over Traditional Gym?

The Core RL Loop

The 3-Component Pattern

Server Side (runs in Docker)

Client Side (your training code)

OpenSpiel Integration

Using OpenSpiel Environments

OpenSpielObservation Fields

Switching Games

Creating a Custom Integration (5 Steps)

Step 1: Define Types (models.py)

Step 2: Implement Server Environment (server/environment.py)

Step 3: Create HTTP Client (client.py)

Step 4: Register the Server (server/app.py)

Step 5: Dockerize (server/Dockerfile)

Reference Examples in the Repo

Architecture Diagram

Resources

Prose

Golang Patterns

Audiocraft Audio Generation

Pokemon Player

Ideation

Storybook Upgrade

Step 1: Define Types (`models.py`)

Step 2: Implement Server Environment (`server/environment.py`)

Step 3: Create HTTP Client (`client.py`)

Step 4: Register the Server (`server/app.py`)

Step 5: Dockerize (`server/Dockerfile`)