DAG上DP的示例分析

发布时间:2021-05-31 14:28:18 作者:小新
来源:亿速云 阅读:197

这篇文章给大家分享的是有关DAG上DP的示例分析的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。

DAG即有向无环图

这里举出两经典的DAG模型,嵌套矩形和硬币问题

嵌套矩形(不固定起点最长路及其字典序)

描述

有n个矩形,每个矩形可以用 (a,b) 来描述,表示长和宽
矩形 X(a,b) 可以嵌套在矩形 Y(c,d) 中,当且仅当 a<c,b<d 或者 b<c,a<d(旋转90度)
例如(1,5)可以嵌套在(6,2)内,但不能嵌套在(3,4)中
你的任务是选出尽可能多的矩形排成一行,使得除最后一个外,每一个矩形都可以嵌套在下一个矩形内

分析

矩形间的“可嵌套”关系是一个典型的二元关系,二元关系可以用图来建模
如果矩形X可以嵌套在Y中,则就从X到Y连一条有向边
这个图是无环的,因为一个矩形无法直接或或间接的嵌套在自己的内部
也即是说这是以一个DAG
因此,我们就是在求DAG上的不固定起点的最长路径

解题

设 d(i) 表示从结点 i 出发的最长路长度

第一步只能走到它的相邻点,那么我们就有:

DAG上DP的示例分析

其中,E为边集,则最终答案是所有的d(i)中的最大值,因此可以用递推或者记忆化搜索计算

第一步,建图,假如用邻接矩阵将矩形间的关系保存在矩阵G中

第二步,编写记忆化搜索程序(调用前先初始化数组为0)

第三步,按字典序输出最佳的方案

假如有这样的 5 个矩形,输入的边长分别是:

DAG上DP的示例分析

建图

DAG上DP的示例分析

先对长和宽来此排序,再按照要求构图, 完成之后,直接记忆化搜索,但由于是不固定起点的,所以不能只从第一个点搜索,而是每个点都要开始搜索

搜索代码:

int dp(int i)
{
    int& ans = d[i];//为表项d[i]声明一个引用ans 
    if(ans > 0)  
        return ans;
    ans = 1;
    for(int j=1;j<n;j++)
        if(G[i][j])
			ans = max(ans,dp(j)+1);
    return ans;
}

这里使用了一个技巧:为表项d[i]声明一个引用ans,这样,任何对ans的读写实际上都是在对d[i]进行。当d[i]换成d [i] [j] [k] [l] [m] [n] 这样很长的名字时,该技巧的优势就会很明显

然后我们要考虑如何输出字典序最小的方案
字典序只是消除并列名次的方法,我们最根本的任务还是求出最长路
在把所有的d值计算出来后,选择最大的d[i]所对应的i,而如果有多个i,则选择最小的i,来保证字典序最小
接下来选择 d(i) = d(j) +1 且i, j ∈E 的任何一个j,但是为满足字典序最小,需选择最小的j,代码如下

void print_ans(int i){
    printf("%d ", i);//第一次i代表最长路的起点节点,以后均代表从该节点开始的路径
    for(int j = 1; j <= n; j++)
        if(G[i][j] && d[i] == d[j]+1)// 如果该图满足可嵌套,且d[i] = d[j] +1
        {
            print_ans(j);
            //立即输出从节点j开始的路径
            break;
        }
}

完整题解代码

#include<stdio.h>
#include<string.h>
#define MAXN 100+1
int n, G[MAXN][MAXN];//存图
int x[MAXN], y[MAXN], d[MAXN]; 

int dp(int i){
    int& ans = d[i];//为表项d[i]声明一个引用ans 
    if(ans > 0)  
        return ans;
    ans = 1;
    for(int j=1;j<=n;j++)
        if(G[i][j])
			ans = max(ans,dp(j)+1);
    return ans;
}

void print_ans(int i){
    printf("%d ", i);//第一次i代表最长路的起点节点,以后均代表从该节点开始的路径
    for(int j = 1; j <= n; j++)
        if(G[i][j] && d[i] == d[j]+1)// 如果该图满足可嵌套,且d[i] = d[j] +1
        {
            print_ans(j);
            //立即输出从节点j开始的路径
            break;
        }
}

int main()
{
    int t, ans, best;
    scanf("%d", &n);
    for(int i = 1; i <= n; i++){
        scanf("%d%d", &x[i], &y[i]);
        if(x[i] > y[i]){
            t = x[i];
            x[i] = y[i];
            y[i] = t;   
            //保证X[]存的是长,Y[]存的是宽
        }
    }
    memset(G, 0, sizeof(G));
    for(int i = 1; i <= n; i++)//建图
        for(int j = 1; j <= n; j++)
            if(x[i] < x[j] && y[i] < y[j])
                G[i][j] = 1;//如果第i个矩形的长宽均小于第j个,使图相应的值为1

    ans = 0;
    for(int i = 1; i <= n; i++)//依次递推所有的的节点
        if(dp(i) > ans){
            best = i;//best是最小字典序
            ans = dp(i);
        }
    printf("ans=%d\n", ans);//表示最长路长度
    print_ans(best);
    printf("\n");
    return 0 ;
}

硬币问题(固定终点的最长路和最短路)

描述

有 n 种硬币,面值分别为V1, V2······Vn,每种都有无限多
给定非负整数 S ,可以选用多少个硬币,使得面值之和恰好为S?
输出硬币数目的最小值和最大值

分析

看上去和嵌套矩形问题很不一样,但本题的本质也是DAG上的路径问题
将每种面值看作一个节点,设初始状态为S,目标状态为0
若当前在状态 i,每使用一个硬币 j,状态便转移到i - Vj

解题

最长路和最短路的求法是类似的,由于终点固定,d(i) 的确切含义变为从结点i出发到结点0的最长路径长度

int dp(int S)
{
    int& ans = d[S];
    if(ans >= 0) 
        return ans;
    ans = 0;
    for(int i=1;i<=n;i++)
        if(S >= V[i])    
            ans = max(ans,dp(S-V[i])+1);
    return ans;
}

回顾一下嵌套矩形的找最长路

int dp(int i)
{
    int& ans = d[i];//为表项d[i]声明一个引用ans 
    if(ans > 0)
        return ans;
    ans = 1;
    for(int j=1;j<n;j++)
        if(G[i][j])
			ans = max(ans,dp(j)+1);
    return ans;
}

由于在本题中,路径长度是可以为0的(S本身可以是0),所以不能再用d=0表示这个d值还没有算过,初始化时也不能再把d全设为0,而要设置为一个负值令初始状态不合法,这里可以用 -1 来表示没有算过,初始化时只需用memset(d,-1,sizeof(d))即可,同时 if(ans>0) 也要改成 if(ans>=0)

但其实,由于结点S不一定真的能到达结点0,所以需要用特殊的d[S]值表示“无法到达”,但在上述代码中,如果S根本无法继续往前走,返回值是0,将被误以为是“已到达终点”的意思

如果把ans初始化为-1呢?但-1代表“还没算过”,所以返回-1相当于放弃了自己的劳动成果

如果把ans初始化为一个很大的整数,从目前来看,它也会被认为是“还没算过”,但至少可以和所有d的初值分开——只需把代码中if(ans>=0)改为if(ans!=-1)即可

int dp(int S)
{
    int& ans = d[S];
    if(ans != -1)   
        return ans;
    ans = -(1<<30);
    for(int i=1;i<=n;i++){
        if(S >= V[i])    
            ans = max(ans,dp(S-V[i])+1);
    }
    return ans;
}

另一个常用的解决方法是不用特殊值表示“还没算过”,而用另外一个数组 vis[i] 表示状态 i 是否被访问过

int dp(int S)
{
    if(vis[S])  
        return d[S];
    vis[S] = -1;
    int& ans = d[S];
    ans = -(1<<30);
    for(int i=1;i<=n;i++)
        if(S >= V[i])    
            ans = max(ans,dp(S-V[i])+1);
    return ans;
}

本题要求最小、最大两个值,记忆化搜索就必须写两个,在这种情况下,用递推更加方便(此时需注意递推的顺序)

minv[0] = maxv[0] = 0;
for(int i=1;i<=S;i++){
    minv[i] = INF;//minv[i]表示最小值
    maxv[i] = -INF;//maxv[i]表示最大值
}
for(int i=1;i<=S;i++){
    for(int j=1;j<=n;j++){
        if(i >= V[j]){
            minv[i] = min(minv[i],minv[i-V[j]]+1);
            maxv[i] = max(maxv[i],maxv[i-V[j]]+1);
        }
    }
}
printf("%d %d\n",minv[S],maxv[S]);

如何输出字典序最小的方案呢?刚刚介绍的方法仍然适用,如下所示:

void print_ans(int* d,int S)
{
    for(int i=1; i<=n; i++)
    {
        if(S>=V[i] && d[S]==d[S-V[i]]+1)
        {
            printf("%d ",i);
            print_ans(d,S-V[i]);
            break;

        }
    }
}

上题打印的是路径上的点,而这里打印的是路径上的边

另外一种常用的打印路径的方法:递推时直接用min_coin[S]记录满足min[S]==min[S-V[i]]+1的最小的i,则打印路径时可以省去print_ans()中的循环,并可以方便地把递归改成迭代 (当然,原来的也可以改成迭代,但不那么自然)具体代码如下

for(int i=1;i<=S;i++){
    for(int j=1;j<=n;j++){
        if(i >= V[j]){
            if(min[i]>min[i-V[j]]+1){
                min[i] = min[i-V[j]]+1;
                min_coin[i] = j;
            }
            if(max[i]<max[i-V[j]]+1){
                max[i] = max[i-V[j]]+1;
                max_coin[i] = j;
            }
        }
    }
}

小结

由于DAG最长 (短)路的特殊性,有两种“对称”的状态定义方式。

状态1:设 d(i) 为从 i 出发的最长路,则

DAG上DP的示例分析

状态2:设 d(i) 为以 i 结束的最长路,则

DAG上DP的示例分析

如果使用状态2,“硬币问题”就变得和“嵌套矩形问题”几乎一样了 (唯一的区别是“嵌套矩形问题”还需要取所有d (i)的最大值)!我们在上面介绍了比较麻烦的状态1,主要是为了展示一些常见技巧和陷阱,实际比赛中不推荐使用。

使用状态2时,有时还会遇到一个问题:状态转移方程可能不好计算,因为在很多时候,可以方便地枚举从某个结点i出发的所有边 (i , j),却不方便“反着”枚举 (j , i)。特别是在有些题目中,这些边具有明显的实际背景,对应的过程不可逆。这时需要用“刷表法”

什么是“刷表法”呢?传统的递推法可以表示成“对于每个状态 i,计算f (i)”,或者称为“填表法”。这需要对于每个状态 i,找到f (i)依赖的所有状态,在某些情况下并不方便。另一种方法是“对于每个状态i,更新f (i)所影响到的状态”,或者称为“刷表法”。对应到DAG最长路的问题中,就相当于按照拓扑序枚举 i,对于每个 i,枚举边 (i , j),然后更新d[j] = max(d[j],d[i]+1)。注意,一般不把这个式子叫做“状态转移方程”,因为它不是一个可以直接计算d[j]的方程,而只是一个更新公式

提示:传统的递推法可以表示成“对于每个状态 i,计算f (i)”,或者称为“填表法”。这需要对于每个状态 i,找到f (i)依赖的所有状态,在某些时候并不方便。另一种方法是“对于每个状态 i,更新f (i)所影响到的状态”,或者称为“刷表法”,有时比填表法方便。但需要注意的是,只有当每个状态所依赖的状态对它的影响相互独立时才能用刷表法

例题

A - A Spy in the Metro

某城市的地铁是线性的,有n(2≤n≤50)个车站,从左到右编号为1~n

有M1辆列车从第1站开始往右开,还有M2辆列车从第n站开始往左开

在时刻0,Mario从第1站出发,目的是在时刻T(0≤T≤200)会见车站n的一个间谍,在车站等车时容易被抓,所以她决定尽量躲在开动的火车上,让在车站等待的总时间尽量短,列车靠站停车时间忽略不计,且Mario身手敏捷,即使两辆方向不同的列车在同一时间靠站,Mario也能完成换乘。

输入:

第1行为n,
第2行为T,
第3行有n-1个整数t1,t2,…,tn−1(1≤ti≤70),
其中ti表示地铁从车站i到i+1的行驶时间(两个方向一样)
第4行为M1(1≤M1≤50),即从第1站出发向右开的列车数目
第5行包含M1个整数d1, d2,…, dM1(0≤di≤250,di<di+1),即各列车的出发时间。
第6、7行描述从第n站出发向左开的列车,格式同第4、5行

输出仅包含一行,即最少等待时间。无解输出impossible

分析

时间是单向流逝的,是一个天然的“序”,而影响到决策的只有当前时间和所处的车站
可以用 d(i,j) 表示:在时刻i,处于在车站j(编号为1~n)时,最少还需要等待的时间
边界条件是d(T,n)=0,其他 d(T,i)(i不等于n)为正无穷

有如下3种决策。

在程序中定义一个三维数组has_train
has_train [t] [i] [0] 表示:时刻t,在车站i是否有往右开的火车
has_train [t] [i] [1] 表示:时刻t,在车站i是否有往左开的火车

核心代码如下:

for (int i = 1; i <= n-1; i++)
    dp[T][i] = INF;
dp[T][n] = 0;

for (int i = T-1; i >= 0; i++)
{
    for (int j = 1; j <=n ; j++)
    {
        dp[i][j] = dp[i+1][j] + 1;
        if(j<n && has_train[i][j][0] && i+t[j] <= T)
            dp[i][j] = min(dp[i][j],dp[i+t[j][j+1]])//右
        if(j>1 && has_train[i][j][1] && i+t[j-1] <= T)
            dp[i][j] = min(dp[i][j],dp[i+t[j-1][j-1]])//左
    }
}

if(dp[0][1])
    puts("impossible");
else
    cout<<dp[0][1]<<endl;

完整ac码

#include <iostream>
#include <stdio.h>
#include <string.h>
using namespace std;
const int INF=0x3f3f3f3f;
int t[50+10];
int dp[200+10][50+10];
int has_train[200+10][50+10][2];

int main()
{
    int n,T,M1,M2,flag;
    int casen=0;
    while(scanf("%d",&n)!=EOF&&n)
    {
        memset(has_train,0,sizeof(has_train));
        memset(t,0,sizeof(t));
        memset(dp,INF,sizeof(dp));
        scanf("%d",&T);
        for(int i=1; i<n; i++)
            scanf("%d",&t[i]);
        scanf("%d",&M1);
        for(int i=1; i<=M1; i++)
        {
            scanf("%d",&flag);
            for(int j=1; j<=n; j++)
            {
                flag+=t[j-1];
                has_train[flag][j][0]=1;
            }
        }
        scanf("%d",&M2);
        for(int i=1; i<=M2; i++)
        {
            scanf("%d",&flag);
            for(int j=n; j>=1; j--)
            {
                flag+=t[j];
                has_train[flag][j][1]=1;
            }
        }
        for(int i=1; i<=n-1; i++)
            dp[T][i]=INF;
        dp[T][n]=0;
        for(int i=T-1; i>=0; i--)
            for(int j=1; j<=n; j++)
            {
                dp[i][j]=dp[i+1][j]+1;
                if(j<n&&has_train[i][j][0]&&i+t[j]<=T)
                    dp[i][j]=min(dp[i][j],dp[i+t[j]][j+1]);
                if(j>1&&has_train[i][j][1]&&i+t[j-1]<=T)
                    dp[i][j]=min(dp[i][j],dp[i+t[j-1]][j-1]);
            }
        cout<<"Case Number "<<++casen<<": ";
        if(dp[0][1]>=INF)
            puts("impossible");
        else
            cout<<dp[0][1]<<endl;
    }
    return 0;
}

B - The Tower of Babylon

有n(n<=30)种立方体,每种都有无穷多个
要求选一些立方体,摞成一根尽量高的柱子(可以自行选择哪一条作为高)
每个立方体的底面长宽分别严格小于它下方立方体的底面长宽

分析

任何时候都只有顶面(底=顶)尺寸会影响到后续决策,美增加一个立方体以后顶面长和宽都必须严格减小,所以这个图也是DAG,可以套用最长路

由于只有三种面,每种立方体只要三个就够了,每输入一个立方体,就可以算作输入了三个不同的立方体(任选一条边作为高),然后每一个立方体建边,套用DAG上的dp模板

#include <bits/stdc++.h>
using namespace std;
const int MAXN = 100+10;

int n;
int H[MAXN];//记录立方体i的高
int d[MAXN];//记录以i为起点的最大高度
int G[MAXN][MAXN];//记录i是否可以作为j的底,存图
int a[3];//3种边长

struct Cube
{
    int x,y;//长和宽
} cube[MAXN];

void have_edge(int i,int j)//i是否可以作为j的底,可以则连边
{ 
    if(cube[i].x>cube[j].x && cube[i].y>cube[j].y)
        G[i][j]=1;
}

int dp(int i)
{
    int &ans = d[i];
    if(ans > 0)
        return ans;
    ans = H[i];
    for(int j=0; j<3*n; j++)
        if(G[i][j])
            ans=max(ans,H[i]+dp(j));
    return ans;
}

int main()
{
    int casen = 0;
    while(scanf("%d",&n)!=EOF&&n)
    {
        int ans=0;
        memset(d,0,sizeof(d));
        memset(G,0,sizeof(G));
        for(int i=0; i<n; i++)
        {
            scanf("%d %d %d",&a[0],&a[1],&a[2]);
            sort(a,a+3);
            cube[3*i].x=a[0],cube[3*i].y=a[1],H[3*i]=a[2];
            cube[3*i+1].x=a[0],cube[3*i+1].y=a[2],H[3*i+1]=a[1];
            cube[3*i+2].x=a[1],cube[3*i+2].y=a[2],H[3*i+2]=a[0];
        }
        for(int i=0; i<3*n; i++)
            for(int j=0; j<3*n; j++)
                have_edge(i,j);
        for(int i=0; i<3*n; i++)
            dp(i);
        for(int i=0 ; i<3*n ; i++)
            ans=max(ans,d[i]);
        printf("Case %d: maximum height = %d\n",++casen ,ans);
    }
    return 0;
}

C - Tour

给定平面n个点(n≤1000)的坐标,按照x递增的顺序给出,保证各点的x都不同且都为正整数

你的任务是设计一条路线,从最左边的点出发,严格向右走到达最右点再严格向左回到最左点,要求除了最左和最右,每个点恰好经过一次,输出最短路径长度

分析

从左到右再回来可以转化成:两个人同事从最左出发,沿着两条不同的路径走,最后到达最右点,并且除了起点和终点都只能有一个人经过,自然想到可以用d(i,j)表示:一个人走到i点,另一个人走到j,还需要走多长距离到达最右点
但是我们发现这样状态好像很难转移,比如计算d(i,j)时,我们不知道能不能让i上的1号同学走到i+1,因为从状态里看不出来i+1有没有被j上的2号同学走过,也就是说这个状态定义的难以转移

然后我们可以简单修改一下定义,让d(i,j)表示:1~max[d(i,j)]全部走过,且两个人目前位置是i和j时,还需要走多长距离到达最右点,在这个定义下d(i,j)=d(j,i),我们再规定始终有i>j,如果j>i了,只需要交换A、B的角色即可,即将i换为j,j换为i,这样,不管是哪个人,下一步只能走到i+1 , i+2,…这些点

那么问题又来了,如果走到i+2,情况变成了“走过1~ i 和 i+2,但是i+1没走过”,不合法

那么直接ban了这个路不就可以了,也就是说,d(i,j)只允许其中一个人走到i+1,而不能走到i+2, i+3,…
换句话说,状态d(i,j)只能转移到d(i+1,j)和d(i+1,i),这里意思就是:如果第一个人直接走到了i+2,那么它再也无法走到i+1了,只能靠第二个人走到i+1,既然如此,现在就让第二个人走到i+1

边界是d(n-1,j) = dist(n-1,n)+dist(j,n),其中dist(a,b)表示点a和b之间的距离,因为根据定义,所有点都走过了,两个人只需直接走到终点。所求结果是dist(1,2)+d(2,1),因为第一步一定是某个人走到了第二个点,根据定义,这就是d(2,1)

#include <bits/stdc++.h>
using namespace std;
const int MAXN=1000+10;
double d[MAXN][MAXN];//第一个走到i第二个人走到j时,还需要走多长距离走完
int n;

struct point
{
    int x, y;//坐标
}p[MAXN];

double dist(int A,int B)//p[A]到p[B]距离,随便怎么实现,这里用hypot()
{
    int X = p[A].x - p[B].x;
    int Y = p[A].y - p[B].y;
    return hypot(X, Y);
}

double dp(int i, int j)//i>j
{
    double& ans = d[i][j];
    if (ans > 0)
        return ans;
    if (i == n - 1)
        return ans = dist(i, n) + dist(j, n);
    ans = min(dp(i + 1, j) + dist(i + 1, i), dp(i + 1, i) + dist(i + 1, j));
    return ans;
}

int main()
{
    while (cin >> n)
    {
        memset(d, 0, sizeof(d));
        for (int i = 1; i <= n; i++)
            cin >> p[i].x >> p[i].y;
        dp(2, 1);
        printf("%.2f\n", dist(2, 1) + d[2][1]);
    }
    return 0;
}

感谢各位的阅读!关于“DAG上DP的示例分析”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!

推荐阅读:
  1. Exchange 2019 DAG配置
  2. java DP背包使用示例

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

dag dp

上一篇:pytorch中优化器optimizer.param_groups用法的示例分析

下一篇:JavaScript有哪些数据类型

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》