【题解】 bzoj1076: [SCOI2008]奖励关（装压+期望dp）

Solution

并不会做，看了下题解大概了解了。期望这个东西好难搞啊qwq
我们定义\(dp[i][j]\)表示第\(i\)步，拿到宝物前的状态为\(j\)。
正着来会有很多不合法的情况，剔除比较麻烦，我们反着来考虑，因为你想如何是合法，就是状态表示拿得物品个数小于等于步数嘛，倒着来最后答案根据我们状态定义可以知道，答案是\(dp[1][0]\)嘛，然后你想，我们每向前一次，就最多剔除一个宝物，最多剔除的就是\(K\)个，其余不合法的情况到最后不会剔除完，就不会被计入答案中
转移方程是\[dp[i][j]=dp[i][j]+\Sigma_{k=1}^n max(dp[i+1][j],dp[i+1][j|(sta[k])+s[k]])/n\] 这个是在\(j\)状态下能加入\(k\)物品.
不然转移方程就是\[dp[i][j]=dp[i][j]+dp[i+1][j]/n\]
多做几道期望dp，感受下吧qwq

Code

//It is coded by ning_mew on 7.21
#include<bits/stdc++.h>
#define db double
using namespace std;

const int maxk=105,maxn=20;

int n,K;
int sta[maxn],s[maxn];
db dp[maxk][(1<<15)+100];

int main(){
  scanf("%d%d",&K,&n);
  for(int i=1;i<=n;i++){
    int box=0;
    scanf("%d",&s[i]);
    while(1){
      scanf("%d",&box);if(!box)break;
      sta[i]=(sta[i]|(1<<(box-1)));
    }
  }
  for(int i=K;i>=1;i--){
    for(int j=0;j<=(1<<n)-1;j++){
      for(int k=1;k<=n;k++){
        if((sta[k]&j)!=sta[k]){dp[i][j]=dp[i][j]+dp[i+1][j]/n;continue;}
        dp[i][j]=dp[i][j]+1.0*max(dp[i+1][j],dp[i+1][j|(1<<(k-1))]+s[k])/n;
      }
    }
  }printf("%0.6f\n",dp[1][0]);return 0;
}

博主蒟蒻，随意转载。但必须附上原文链接：http://www.cnblogs.com/Ning-Mew/，否则你会场场比赛暴0！！！

原文地址：https://www.cnblogs.com/Ning-Mew/p/9347977.html

时间： 2024-10-08 16:27:08

【题解】 bzoj1076: [SCOI2008]奖励关（装压+期望dp）的相关文章

P2473 [SCOI2008]奖励关(状压+期望dp）

题目描述你正在玩你最喜欢的电子游戏,并且刚刚进入一个奖励关.在这个奖励关里,系统将依次随机抛出k次宝物,每次你都可以选择吃或者不吃(必须在抛出下一个宝物之前做出选择,且现在决定不吃的宝物以后也不能再吃). 宝物一共有n种,系统每次抛出这n种宝物的概率都相同且相互独立.也就是说,即使前k-1 次系统都抛出宝物1(这种情况是有可能出现的,尽管概率非常小),第k次抛出各个宝物的概率依然均为1/n. 获取第 i 种宝物将得到Pi分,但并不是每种宝物都是可以随意获取的.第i种宝物有一个前提宝物集合Si.

P2473 || SCOI2008 奖励关 //状压&&期望DP

https://www.luogu.org/problemnew/show/P2473 一句话题意:有n种宝物,捡起会有得分(可能为负),有k轮可以捡起宝物.其中有些宝物,需要另外的宝物捡起过才能捡起. 问采取最优策略的期望得分. 解:期望的最大特点在于难写的递推式和倒序DP 但这道题没那么恶心,递推式还是挺好写的(指看完题解之后可以自己写出DP式子) f[i][S]表示在第1轮到第i-1轮内宝物是否取过的状态为S,第i轮到第K轮的最大期望得分 f [ i ][ S ] 在S满足时可以取或不取

bzoj1076: [SCOI2008]奖励关状压dp

Description 你正在玩你最喜欢的电子游戏,并且刚刚进入一个奖励关.在这个奖励关里,系统将依次随机抛出k次宝物, 每次你都可以选择吃或者不吃(必须在抛出下一个宝物之前做出选择,且现在决定不吃的宝物以后也不能再吃). 宝物一共有n种,系统每次抛出这n种宝物的概率都相同且相互独立.也就是说,即使前k-1次系统都抛出宝物1( 这种情况是有可能出现的,尽管概率非常小),第k次抛出各个宝物的概率依然均为1/n. 获取第i种宝物将得到Pi 分,但并不是每种宝物都是可以随意获取的.第i种宝物有一个前提

BZOJ 1076 奖励关(状压期望DP)

当前得分期望=(上一轮得分期望+这一轮得分)/m dp[i,j]:第i轮拿的物品方案为j的最优得分期望如果我们正着去做,会出现从不合法状态(比如前i个根本无法达到j这种方案),所以从后向前推如果当前方案j里具备了取k这个物品的条件那么dp[i,j]+=max{dp[i+1,j],dp[i+1,j or 1<<(k?1)]+x[k]} 否则dp[i,j]+=dp[i+1,j] #include<cstdio> #include<iostream> using n

【BZOJ1076】[SCOI2008]奖励关状压DP+期望

[BZOJ1076][SCOI2008]奖励关 Description 你正在玩你最喜欢的电子游戏,并且刚刚进入一个奖励关.在这个奖励关里,系统将依次随机抛出k次宝物,每次你都可以选择吃或者不吃(必须在抛出下一个宝物之前做出选择,且现在决定不吃的宝物以后也不能再吃). 宝物一共有n种,系统每次抛出这n种宝物的概率都相同且相互独立.也就是说,即使前k-1次系统都抛出宝物1(这种情况是有可能出现的,尽管概率非常小),第k次抛出各个宝物的概率依然均为1/n. 获取第i种宝物将得到Pi分,但并不是每种宝

bzoj1076: [SCOI2008]奖励关(期望dp+状压dp)

1076: [SCOI2008]奖励关 Time Limit: 10 Sec Memory Limit: 128 MBSubmit: 2989 Solved: 1557[Submit][Status][Discuss] Description 你正在玩你最喜欢的电子游戏,并且刚刚进入一个奖励关.在这个奖励关里,系统将依次随机抛出k次宝物,每次你都可以选择吃或者不吃(必须在抛出下一个宝物之前做出选择,且现在决定不吃的宝物以后也不能再吃). 宝物一共有n种,系统每次抛出这n种宝物的概率都相同且相

BZOJ1076: [SCOI2008]奖励关

1076: [SCOI2008]奖励关 Time Limit: 10 Sec Memory Limit: 128 MBSubmit: 1669 Solved: 921[Submit][Status][Discuss] Description 你正在玩你最喜欢的电子游戏,并且刚刚进入一个奖励关.在这个奖励关里,系统将依次随机抛出k次宝物, 每次你都可以选择吃或者不吃(必须在抛出下一个宝物之前做出选择,且现在决定不吃的宝物以后也不能再吃). 宝物一共有n种,系统每次抛出这n种宝物的概率都相同且

【BZOJ-1076】奖励关概率与期望 + 状态压缩DP

1076: [SCOI2008]奖励关 Time Limit: 10 Sec Memory Limit: 128 MBSubmit: 1602 Solved: 891[Submit][Status][Discuss] Description 你正在玩你最喜欢的电子游戏,并且刚刚进入一个奖励关.在这个奖励关里,系统将依次随机抛出k次宝物,每次你都可以选择吃或者不吃(必须在抛出下一个宝物之前做出选择,且现在决定不吃的宝物以后也不能再吃). 宝物一共有n种,系统每次抛出这n种宝物的概率都相同且相互

[BZOJ1076][SCOI2008]奖励关解题报告|状压DP

你正在玩你最喜欢的电子游戏,并且刚刚进入一个奖励关.在这个奖励关里,系统将依次随机抛出k次宝物,每次你都可以选择吃或者不吃(必须在抛出下一个宝物之前做出选择,且现在决定不吃的宝物以后也不能再吃). 宝物一共有n种,系统每次抛出这n种宝物的概率都相同且相互独立.也就是说,即使前k-1次系统都抛出宝物1(这种情况是有可能出现的,尽管概率非常小),第k次抛出各个宝物的概率依然均为1/n. 获取第i种宝物将得到Pi分,但并不是每种宝物都是可以随意获取的.第i种宝物有一个前提宝物集合Si.只有当Si中所有

【题解】 bzoj1076: [SCOI2008]奖励关 （装压+期望dp）

Solution

Code

【题解】 bzoj1076: [SCOI2008]奖励关 （装压+期望dp）的相关文章

【题解】 bzoj1076: [SCOI2008]奖励关（装压+期望dp）

【题解】 bzoj1076: [SCOI2008]奖励关（装压+期望dp）的相关文章