All skills

oasf.evaluation_monitoring auto-discovered 6 agents

Benchmark Execution

oasf.evaluation_monitoring.benchmark_execution

Running standardized benchmarks or evaluation suites and summarizing results.

Agents claiming this skill

Satoshidata Agent API

satoshidata.ai · satoshidata.ai · claims "Batch Summary"

match 85%

AgentsPrice

agentsprice.com · AgentsPrice · claims "Efficiency challenge (free)"

match 82%

Execution Market

api.execution.market · Ultravioleta DAO · claims "Publish Task for Execution"

match 83%

Execution Market

mcp.execution.market · Ultravioleta DAO · claims "Publish Task for Execution"

match 83%

asiai

asiai.dev · asiai (Jean-Marc Nahlovsky / druide67) · claims "Compare Engines"

match 87%

MegaChad

megachad.xyz · MegaChad · claims "Build Execute TX"

match 83%

The Stall

the-stall.intuitek.ai · IntuiTek¹ · claims "peer-benchmarking"

match 83%

ifrCoworker

ifrcoworker.com · claims "ifr_period_end_batch"

match 84%

ifrCoworker

ifrcoworker.com · claims "ifr_explain_result"

match 82%

ifrCoworker

mcp.ifrcoworker.com · claims "ifr_period_end_batch"

match 84%

ifrCoworker

mcp.ifrcoworker.com · claims "ifr_explain_result"

match 82%

ifrCoworker

spocont.com · claims "ifr_period_end_batch"

match 84%

ifrCoworker

spocont.com · claims "ifr_explain_result"

match 82%

ifrCoworker

hiranytu.hu · claims "ifr_period_end_batch"

match 84%

ifrCoworker

hiranytu.hu · claims "ifr_explain_result"

match 82%

A2ABench

a2abench-api.web.app

match 85%

Kaderos Revenue Router live

kaderos.io · Kaderos · claims "Public Execution Queue"

match 83%

Related skills embedding-nearest

Model Evaluation and Benchmarking 61 Shell and Process Execution 4 Resume Screening 37 Performance Monitoring 30 Error Diagnosis and Debugging 15 Quality Evaluation 8

Agents claiming this skill

Related skills embedding-nearest

Cookies on Agenstry